読み方 : れつしこうデータベース
列指向データベース【column-oriented database】カラム型データベース/columnar database
概要
列指向データベースとは、データを表の形で格納するリレーショナルデータベース管理システム(RDBMS)のうち、一般的な行ごとの格納方式ではなく、列ごとの格納方式を採用したもの。分析処理に適した構造を持ち、大量データの集計や検索を効率化することができる。

従来のデータベース管理システムは「行指向」の格納方式が一般的で、物理的なストレージ上で1行分のデータを続けて連続的に記録する。同じレコードに属するデータは近い場所に記録されているため、格納されたデータをレコード単位で検索したり更新したりするような用途に向いている。
一方、列指向データベースでは、同じ列に属するデータを連続して保存する。例えば、売上表における「日付」列、「商品名」列、「金額」列をそれぞれ独立して格納する構造である。売上分析を行う際、「金額」の列だけを連続して読み取るといった操作とが可能なため、同じ行の別のデータを読み込まずに済み、物理的なデータ入出力(I/O)を減らして処理を高速化することができる。
また、同一列には同種のデータが並ぶため、データ圧縮との相性が良いという特性がある。値の繰り返しや類似性を利用した圧縮方式を適用しやすく、保存容量の削減やメモリ効率の向上につながる。データサイズが小さくなれば、ストレージ容量の節約になるだけでなく、メモリへの転送速度も向上し、さらなる処理効率の向上に繋がる。
このような特性から、列指向データベースは主にデータウェアハウス(DWH)やビジネスインテリジェンス(BI)などの分野で活用されている。日々の細かな取引を記録する用途よりも、蓄積された膨大な過去のデータを解析して傾向を導き出すような用途で威力を発揮する。製品としてはオープンソースのApache Cassandraなどががよく知られており、Amazon RedshiftやGoogle BigQueryのようなクラウドサービスとしても提供されている。