Google Colaboratoryでのファイル読み込み方法
こんにちは!うしじです。
無料でGPUを利用できるというGoogle Colaboratoryを使ってみました。今回は、そのファイル読み込み方法についてまとめています。
ファイルの読み込みは、下記の3つの手順で行います。Deep Learningでは、画像ファイルや音声ファイル等のサイズの大きなファイルを扱いますが、Google Colabでは、これらのファイルをGoogle Driveに置いて扱います。
- Google Colabで、Google Driveをマウント
- Google Driveに、対象のファイルをアップロード
- Google Colabで、対象のファイルを読み込んで利用
Google Colabのはじめ方から順に説明していきたいと思います。
Google Colabのはじめ方
Google Colabは、無料で利用可能です。下記のリンクにアクセスすれば、使うことができます。
(USでは、高速なGPUを優先的に利用可能な、有償版のColab Proが始まったようですが、2020年5月現在、日本ではまだのようです。)
上記のリンクをクリックすると、下記のような画面が開くと思います。
右下の"ノートブックを新規作成"をクリックすれば、新規ファイルを作成してColabの利用を開始できます。
これで、下記のようなnotebookが開いたと思います。Colabは、Jupyter Notebookと同じように利用可能です。
GPUを利用する場合は、"ランタイムのタイプを変更"を選び、ハードウェア アクセラレータを"GPU"に変更すれば大丈夫です。
私は使ったことがありませんが、"TPU"も利用可能です。
Google Colab ファイル読み込み方法
Google Colabでは、PCのローカルにあるファイルを直接利用することができません。そのため、Google Drive上にファイルを置いて利用します。
ファイル読み込みは、冒頭に記載した3ステップで出来ますので、順に説明していきます。
1. Google Colabで、Google Driveをマウント
Google Driveをマウントするには、メニューから行う方法と、コマンドで実行する方法があります。
メニューからマウント
画面左側のフォルダマークを選択し、"ドライブをマウント"、"GOOGLEドライブに接続"を押します。
この後、Googleアカウントへのログインが求められると思いますので、そのまま進めればマウント出来ます。
コマンドでマウント
下記のコマンドを入力して実行し、図のプロセスのように進めます。
from google.colab import drive
drive.mount('/content/drive')
これでマウント完了です。Google Colabの"/content/drive"配下に、Google Driveである"My Drive"が追加されます。
2. Google Driveに、対象のファイルをアップロード
対象のファイルは、Google Driveにアップロードします。Google Driveのページからアップロードしても良いですし、下記図のように、Colabからもアップロード出来ます。
今回は、My Drive直下に、Kaggle Titanicのトレーニングファイル"train.csv"をアップロードしました。
"注: アップロードしたファイルはランタイムのリサイクル時に削除されます。"とメッセージが出ますが、Google Driveにアップロードしているので、削除されないはずです。
3. Google Colabで、対象のファイルを読み込んで利用
あとは、アップロードしたファイルを読み込んで使うだけです。/content/drive/My Drive/train.csv
がファイルへのパスです。
import csv
csvfile = open('/content/drive/My Drive/train.csv', encoding='utf-8')
csvreader = csv.DictReader(csvfile)
for row in csvreader:
print(row)
また、ファイルパスについてですが、コピーして利用することも出来ます。
以上で、Google Colabでのファイルの読み込みが完了です!