データガバナンス【data governance】

企業などの組織におけるデータ管理の統制活動であり、データの定義と標準化(同じ項目を部門ごとに異なる名称や形式で管理している状態の統一)、データ品質の維持(重複や欠損、誤りの検出と修正)、データへのアクセス権限の管理(誰がどのデータを参照・編集できるかの制御)、データのライフサイクル管理(生成から保存・廃棄までの一貫した管理)、法令や規制への対応(GDPRや個人情報保護法などへの準拠)などが含まれる。
組織構造としては、データガバナンスの方針決定を担うデータガバナンス委員会や、データの定義と品質に責任を持つデータスチュワード、技術的な管理を担うデータエンジニアやDBA(Database Administrator)といった役割が設けられることが多い。CDO(最高データ責任者)を設置してデータ戦略全体を統括する体制をとる企業も増えている。
データガバナンスの実装において重要なツールの一つに「データカタログ」がある。これは組織内に存在するデータセットのメタデータ(どこにどんなデータがあるか、定義、オーナー、更新頻度など)を一元的に管理・検索できるようにする専門的なシステムで、組織内のデータを統一的に管理するための基盤を提供する。企業向けの製品として「Collibra」「Alation」「Google Dataplex」などが提供されている。
近年では、GDPRの施行や日本の個人情報保護法の改正を機に、コンプライアンス対応としてデータガバナンスの整備に着手する企業も増えている。ビッグデータ活用やAI活用の推進においても、信頼できるデータ基盤の前提としてガバナンス体制の整備が求められる場面が多くなっている。