データウェアハウス 【DWH】 data warehouse
概要
データウェアハウス(DWH)とは、企業などの業務上発生した取引記録などのデータを時系列に保管したデータベース。また、そのようなシステムを構築・運用するためのソフトウェア。“warehouse” は「倉庫」の意。一般的にデータウェアハウスは雑多なデータを単にそのまま記録するわけでなく、組織内で運用される様々な情報システムやデータベースなどからデータを集めて同じ意味のデータは横断的に扱えるようにするなど統合し、データの主題ごとに整理し直して格納する。このデータの収集や整形、統合を専門に行うツールを「ETLツール」(Extract/Transform/Load、ELTツールとも)という。
データは発生した時系列に記録していき、更新や削除は行わなず、過去のある時点の個別のデータを参照できるように格納される。集積された過去のデータを元に、OLAPやBIツールなどの分析ツールを用いて抽出や集計、解析、比較などを行なって、計画立案や意思決定などのために有用な知見を得るために構築されることが多い。
データマート
蓄積された個々のデータの中から、利用部門や用途、目的などに応じて必要なものだけを抽出、集計し、利用しやすい形に格納したデータベースを作成する場合があり、これを「データマート」(data mart)という。小規模なシステムではデータウェアハウスを作らずにデータマートだけを構築することもある。
データレイク
データウェアハウスは原則としてリレーショナルデータベース(RDB)など構造化されたデータ形式で記録されたものを対象とするが、近年では情報システムの種類や利用方法の多様化、複雑化を受け、文書ファイルやソーシャルメディアの書き込みなど構造や形式が整っていないデータを扱う機会が増えている。形式によらず非構造化データを含む雑多なデータを一元的に保管する管理システムやデータ群のことを「データレイク」(data lake)という。
(2020.12.7更新)
関連用語
他の辞典による解説 (外部サイト)
- 情報処理学会 ISディジタル辞典 「データウェアハウス」
- 大塚商会 IT用語辞典 「データウェアハウス」
- 日経 xTECH Active キーワード 「DWH」
- 日経 xTECH ITレポート(キーワード3分間講座) 「データ・ウエアハウス」
- 日経 xTECH IT基本用語辞典 「データウエアハウス」
- 日経 xTECH ものづくり用語 「データ・ウエアハウス」
- ITmedia エンタープライズ 情報システム用語事典 「データウェアハウス」
- IDCフロンティア クラウド・データセンター用語集 「データウェアハウス」
- DAC Solution Service デジタルマーケティング用語集 「データウェアハウス」
- Insider's Computer Dictionary 「データウェアハウス」
この記事を参照している文書など (外部サイト)
- 日商エレクトロニクス Azure導入支援デスク ブログ「今さら聞けない「DWH」とは? ~データベースやデータマートとの比較も含めて解説!~」にて引用 (2024年2月)
- 日本薬剤疫学会「薬剤疫学」27巻1号「グローバルRWD 規格の活用 ―OMOP CDM とOHDSI―」(PDFファイル)にて引用 (2022年6月)