読み方 : クリスプディーエム
CRISP-DM【Cross-Industry Standard Process for Data Mining】
概要

業種や職種、データの種類や分析の目的を問わず、様々な分野や業界で利用できる汎用的な分析プロセスの標準を定義している。一度の分析を行うための直線的なモデルではなく、必要に応じて前の段階に戻ったり、新たに得られた知見をモデルに反映するといった継続的、循環的な活動を想定している。主要な段階(フェーズ)として以下の6つが定義されている。
- ビジネス理解(business understanding) … ビジネス観点から分析の目的や課題を明確化する。
- データ理解(data understanding) … 必要なデータを収集し、探索的な解析で特徴を把握する。
- データ準備(data preparation) … 欠損値の処理や特徴量生成など、データを分析に適した形式に加工する。
- モデリング(modeling) … 分析に適したモデルやアルゴリズムを選択し、データに基づくモデルの構築を行う。
- 評価(evaluation) … 構築したモデルが当初の目的をどの程度満たしているか評価し、展開可否を判断する。
- 展開(deployment) … モデルを実際の業務環境に組み込み、継続的に利用できる体制を整える。
(2025.12.10更新)