データガバナンス【data governance】

概要

データガバナンスとは、組織内で扱われるデータの品質や管理方法、利用ルールを統制するための枠組み。データの作成から保管、利用、廃棄に至るまでの運用を定める管理活動の総体である。
データガバナンスのイメージ画像

企業などの組織におけるデータ管理の統制活動であり、データの定義と標準化(同じ項目を部門ごとに異なる名称や形式で管理している状態の統一)、データ品質の維持(重複や欠損、誤りの検出と修正)、データへのアクセス権限の管理(誰がどのデータを参照・編集できるかの制御)、データライフサイクル管理(生成から保存・廃棄までの一貫した管理)、法令や規制への対応(GDPR個人情報保護法などへの準拠)などが含まれる。

組織構造としては、データガバナンスの方針決定を担うデータガバナンス委員会や、データの定義と品質に責任を持つデータスチュワード、技術的な管理を担うデータエンジニアやDBADatabase Administrator)といった役割が設けられることが多い。CDO(最高データ責任者)を設置してデータ戦略全体を統括する体制をとる企業も増えている。

データガバナンスの実装において重要なツールの一つに「データカタログ」がある。これは組織内に存在するデータセットメタデータ(どこにどんなデータがあるか、定義、オーナー、更新頻度など)を一元的に管理・検索できるようにする専門的なシステムで、組織内のデータを統一的に管理するための基盤を提供する。企業向けの製品として「Collibra」「Alation」「Google Dataplex」などが提供されている。

近年では、GDPRの施行や日本の個人情報保護法の改正を機に、コンプライアンス対応としてデータガバナンスの整備に着手する企業も増えている。ビッグデータ活用やAI活用の推進においても、信頼できるデータ基盤の前提としてガバナンス体制の整備が求められる場面が多くなっている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。