データウェアハウス 【DWH】 data warehouse

概要

データウェアハウス(DWH)とは、企業などの業務上発生した取引記録などのデータを時系列に保管したデータベース。また、そのようなシステム構築運用するためのソフトウェア。“warehouse” は「倉庫」の意。

一般的にデータウェアハウスは雑多なデータを単にそのまま記録するわけでなく、組織内で運用される様々な情報システムデータベースなどからデータを集めて同じ意味のデータは横断的に扱えるようにするなど統合し、データの主題ごとに整理し直して格納する。このデータの収集や整形、統合を専門にツールを「ETLツール」(Extract/Transform/LoadELTツールとも)という。

データは発生した時系列に記録していき、更新や削除はわなず、過去のある時点の個別のデータを参照できるように格納される。集積された過去のデータを元に、OLAPBIツールなどの分析ツールを用いて抽出や集計、解析、比較などをなって、計画立案や意思決定などのために有用な知見を得るために構築されることが多い。

データマート

蓄積された個々のデータの中から、利用部門や用途、目的などに応じて必要なものだけを抽出、集計し、利用しやすい形に格納したデータベースを作成する場合があり、これを「データマート」(data mart)という。小規模なシステムではデータウェアハウスを作らずにデータマートだけを構築することもある。

データレイク

データウェアハウスは原則としてリレーショナルデータベースRDB)など構造化されたデータ形式で記録されたものを対象とするが、近年では情報システムの種類や利用方法の多様化、複雑化を受け、文書ファイルソーシャルメディアの書き込みなど構造や形式が整っていないデータを扱う機会が増えている。形式によらず非構造化データを含む雑多なデータを一元的に保管する管理システムデータ群のことを「データレイク」(data lake)という。

(2020.12.7更新)

他の辞典による解説 (外部サイト)

この記事を参照している文書など (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる