では、実際に
BigQueryを利用しましょう。これはデータにアクセスするためのものですので、あらかじめデータを用意しておく必要があります。これは通常、CSVファイルとして作成しておき、これをアップロードして使う、といったやり方になります。
では、CSVファイルを作成しましょう。これはGoogleドキュメントやExcelなどでスプレッドシートにデータを記入し、エクスポートするのが一番簡単でしょう。今回、サンプルとして用意するのは、「
name」「
mail」「
age」といった3つのフィールドからなるデータです。もし、オフィスソフトなど使ってない、という方は、テキストエディタで直接データを書いて保存してください。
tuyano,syoda@tuyano.com,123
hanako,hanako@flower,23
sachiko,sachiko@happy,34
例えばこんな感じですね。これで「
.csv」という拡張子でファイルを保存すればOKです。
■BigQuery Browser Toolによるテーブル準備
では、
BigQueryにCSVファイルをアップロードしてデータテーブルを作成しましょう。これは、
BigQuery Browser ToolというWebのツールを利用するのが一番です。以下のアドレスうにアクセスしてください。
https://bigquery.cloud.google.com/
このツールでも、
API Consoleと同様にプロジェクトを開き、そこに
BigQueryのデータ類を作成していきます。
BigQueryでは、「
データセット」と「
テーブル」というものを作成します。データセットというのは、各種のデータ類をまとめるためのもので、一般のデータベースでいえば「
データベース」に相当するものでしょう。そしてその中に
テーブルが作成されます(これはデータベースでおなじみですね)。
では、左側のプロジェクト名の項目右にある▼をクリックし、
<Create new dataset>メニューを選んで新たにデータセットを作成しましょう。メニューを選ぶと、Dataset ID」というものを尋ねてくるので、ここで適当にID(要するに名前です)を入力してください。
作成されたデータセット名が左側のリストに表示されたら、その▼をクリックし、
<Create new table>メニューを選びます。これを選ぶと、いろいろと入力をするためのダイアログパネルが現れます。以下のように設定をしましょう。
Table ID――要するにテーブルの名前です。ここでは「
mytable」としておきます。
Schema――テーブルの内容を記述します。これは、「フィールド名:種類, フィールド名:種類,……」というように記述していきます。今回は、以下のように記述をしてください。
name:string, mail:string, age:integer
File Upload/Google Cloud Storage――ファイルを直接アップロードするか、
Google Cloud Storageのファイルを使うかを指定するものです。今回は、「File Upload」を選択し、右側の「
Choose file」ボタンを押して、作成しておいたCSVファイルを選択しましょう。これらを設定し、OKすればテーブルが作成されます。
●作成したデータの情報についてBigQueryで作成し利用するものは「プロジェクト」内に作った「データセット」内の「テーブル」です。BigQueryを外部から利用する場合、この3つの情報が必要になります。
左側のリストから「
Job History」という項目を選んでください。すると右側に「
Recent Jobs」という表示が現れ、そこに「
load」という表示が現れるはずです。その右側に、「
uploaded file to なんたらかんたら」と表示されているはずです。これをどこかに記しておいてください。これは、以下のようになっています。
プロジェクトID:データセット名:テーブル名
この3つの値がコロン(:)でつなげられていることがわかるでしょう。この3つの値は、後ほど使いますので忘れないように!
――さあ、これで
BigQuery側の準備は整いました。