読み方 : れつしこうデータベース

列指向データベース【column-oriented database】カラム型データベース/columnar database

概要

列指向データベースとは、データを表の形で格納するリレーショナルデータベース管理システムRDBMS)のうち、一般的な行ごとの格納方式ではなく、列ごとの格納方式を採用したもの。分析処理に適した構造を持ち、大量データの集計や検索を効率化することができる。
列指向データベースのイメージ画像

従来のデータベース管理システムは「行指向」の格納方式が一般的で、物理的なストレージ上で1行分のデータを続けて連続的に記録する。同じレコードに属するデータは近い場所に記録されているため、格納されたデータレコード単位で検索したり更新したりするような用途に向いている。

一方、列指向データベースでは、同じ列に属するデータを連続して保存する。例えば、売上表における「日付」列、「商品名」列、「金額」列をそれぞれ独立して格納する構造である。売上分析を行う際、「金額」の列だけを連続して読み取るといった操作とが可能なため、同じ行の別のデータを読み込まずに済み、物理的なデータ入出力(I/O)を減らして処理を高速化することができる。

また、同一列には同種のデータが並ぶため、データ圧縮との相性が良いという特性がある。値の繰り返しや類似性を利用した圧縮方式を適用しやすく、保存容量の削減やメモリ効率の向上につながる。データサイズが小さくなれば、ストレージ容量の節約になるだけでなく、メモリへの転送速度も向上し、さらなる処理効率の向上に繋がる。

このような特性から、列指向データベースは主にデータウェアハウスDWH)やビジネスインテリジェンス(BI)などの分野で活用されている。日々の細かな取引を記録する用途よりも、蓄積された膨大な過去のデータを解析して傾向を導き出すような用途で威力を発揮する。製品としてはオープンソースApache Cassandraなどががよく知られており、Amazon RedshiftやGoogle BigQueryのようなクラウドサービスとしても提供されている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。