メダリオンアーキテクチャ【medallion architecture】

メダリオンアーキテクチャとは?

企業などの組織におけるデータ基盤の設計手法の一つで、データを「ブロンズ」「シルバー」「ゴールド」の三層に分けて段階的に加工・管理する方式。各層を経るごとにデータの品質が高まり、最終的にビジネスの現場で即座に活用できる形に整えられる。
メダリオンアーキテクチャのイメージ画像

ブロンズ層は、すべての出発点となる領域である。外部のシステム、センサーログファイルAPIなど多様なソース(データ生成源)から収集した生データを、加工せずそのままの状態で格納する。誤りや重複が含まれていても、この時点では問題にしない。元データを原形のまま保持しておくことで、後から処理方法を変更したい場合や、問題の原因を遡って調べたい場合に、いつでも最初の地点に立ち返ることができる。

シルバー層では、ブロンズ層の生データに対してクレンジングと整形が施される。重複レコードの除去、欠損値の補完、表記の統一、複数ソースのデータの統合といった作業を経て、データは分析に耐えられる一定の品質水準に達する。特定の業務用途に向けた集計や要約はまだ行わないが、専門的な分析者が探索的な調査を行うための共通基盤として機能する。

ゴールド層には、特定の業務目的に合わせてさらに加工を施したデータが格納される。売上の集計、顧客ごとの購買傾向の要約、KPIの計算結果など、経営者や現場担当者がそのままレポートやダッシュボードに利用できる形に仕上げられる。BIツールが参照するのは主にこの層であり、データの価値が最も高まった状態といえる。

データを一括で処理しようとすると、どの工程でエラーが発生したかの特定が困難になる。メダリオンアーキテクチャは処理を三段階に分離することで、問題発生時の影響範囲を絞り込みやすくし、システム全体の保守性を高める。同じ生データを異なる分析目的に応じて再利用することも容易になり、組織内でのデータ活用の柔軟性が増す。米データブリックス(Databricks)社が2019年に提唱し、「データレイクハウス」(data lakehouse)と呼ばれる基盤の普及とともに広く採用されるようになった設計手法である。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。