BigQuery
概要
BigQueryとは、米グーグル(Google)社のGoogle Cloudサービスの品目の一つで、契約者の持ち込んだビッグデータを高速に解析することができるもの。テラバイト級の巨大なデータにわずか数十秒でSQL文を実行することができる。同社が社内利用向けに開発していた「Dremel」(ドレメル)というソフトウェアを基盤としており、一般的なリレーショナルデータベース(RDBMS)としてSQLクエリを実行することができる。カラム型と呼ばれるデータ格納方式を取っており、テーブルの中の同じ列のデータをまとめて格納するため、特定のデータ項目に対する集計などの処理を高速に実行できる。
同社の巨大なITインフラを活用し、クライアントが処理を依頼したサーバを起点として中継サーバを介して末端のサーバへ樹状(ツリー状)に処理を分散し、大量のサーバによる並行処理と高速な結果集約を実現している。同社では数十億件のデータを数十秒で処理可能であるとしている。
サーバやソフトウェアの管理を同社側で行うマネージド型のサービスであり、DBMSなどのソフトウェアの導入や設定の調整といった作業は不要である。手元のデータを送信するだけですぐに解析などの本質的な作業に取り掛かることができる。Google Cloudの他のサービスとの連携も容易である。
料金体系はデータ容量と処理量に応じた従量課金だが、毎月容量10GBまで、処理量1TBまでの無料枠が存在する。解析対象のデータの送受信には費用がかからないが、データの発生源から連続的に追加を行うストリーミング挿入、BigQueryから連続的にデータを引き出すストリーミング読み取りは有料(従量制)となる。
(2021.9.13更新)