読み方 : クリスプディーエム

CRISP-DM【Cross-Industry Standard Process for Data Mining】

概要

CRISP-DMとは、データ分析プロジェクトを体系的に進めるための業界横断的な標準モデル。業務上のデータ分析のプロセスを標準化したもので、ビジネス理解からモデル運用までの工程を整理し、再現性と効率性を高める。
CRISP-DMのイメージ画像

業種や職種、データの種類や分析の目的を問わず、様々な分野や業界で利用できる汎用的な分析プロセスの標準を定義している。一度の分析を行うための直線的なモデルではなく、必要に応じて前の段階に戻ったり、新たに得られた知見をモデルに反映するといった継続的、循環的な活動を想定している。主要な段階(フェーズ)として以下の6つが定義されている。

  1. ビジネス理解(business understanding) … ビジネス観点から分析の目的や課題を明確化する。
  2. データ理解(data understanding) … 必要なデータを収集し、探索的な解析で特徴を把握する。
  3. データ準備(data preparation) … 欠損値の処理や特徴量生成など、データを分析に適した形式に加工する。
  4. モデリング(modeling) … 分析に適したモデルやアルゴリズムを選択し、データに基づくモデルの構築を行う。
  5. 評価(evaluation) … 構築したモデルが当初の目的をどの程度満たしているか評価し、展開可否を判断する。
  6. 展開(deployment) … モデルを実際の業務環境に組み込み、継続的に利用できる体制を整える。
(2025.12.10更新)
この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。