読み方 : クラスターぶんせき
クラスター分析 【cluster analysis】 データクラスタリング / data clustering / クラスタ解析

分類の仕方により、分類した集団の内部をさらに小さな集団に段階的に分類していく階層的手法と、全体をいくつかの集団に分類する非階層的手法がある。
対象間には何らかの基準に基づいて距離を定義する。距離が近い対象同士は似ているとみなして同じ集団に分類する。空間内の単純な直線距離であるユークリッド距離を用いることが多いが、他にも市街地距離(マンハッタン距離)やマハラノビス距離、コサイン類似度など様々な尺度が提唱されている。
具体的な分類アルゴリズムにもいくつかの種類があり、階層的手法としては最短距離法や最長距離法、ウォード法、群平均法などが、非階層的手法としてはk平均法(k-means法)がよく知られている。
(2019.7.4更新)
「クラスター分析」の関連用語
他の用語辞典による「クラスター分析」の解説 (外部サイト)
- ウィキペディア「クラスター分析」
- ITmedia エンタープライズ 情報システム用語事典「クラスター分析」
- SynergyMarketing マーケティング用語集「クラスター分析」
- Techopedia (英語)「Cluster Analysis」
資格試験などの「クラスター分析」の出題履歴
▼ 基本情報技術者試験
【令2修7 問69】 観測データを類似性によって集団や群に分類し,その特徴となる要因を分析する手法はどれか。
【平24修7 問75】 クラスタ分析の結果を表す図はどれか。
【平23修12 問68】 観測データを類似性によって集団や群に分類し,その特徴となる要因を分析する手法はどれか。