クラスタリング 【clustering】 クラスタ化

概要

クラスタリング(clustering)とは、同じ種類のものを複数集めて一つにする操作や仕組みのこと。情報システム分野では複数のコンピュータを繋いで一体的に運用する仕組みを、データ解析分野では多数のデータ群を似た特徴を持つ集団に分類する手法を指す。

コンピュータクラスタ

情報システム分野では、同じ構成の複数のコンピュータを相互接続し、外部に対して全体で一台のコンピュータであるかのように振る舞わせることをクラスタリング、そのような構成のシステムを「コンピュータクラスタ」という。並列処理による性能の向上、多重化による信頼性の向上を図ることができる。

オペレーティングシステム(OS)などの機能として提供され、一般的なコンピュータ製品とネットワーク(LAN)で利用できる簡易なものから、専用のハードウェアや接続インターフェース(インターコネクト)により構成される高度な製品まで様々な方式がある。

コンピュータ間の接続や連携などは専用のクラスタソフトが行い、利用者やソフトウェアからは一台のコンピュータとして通常と同じ方法で操作・使用することができる。クラスタリング技術により連結されたコンピュータ群を「クラスタシステム」あるいは「コンピュータクラスタ」という。

クラスタリングを行う目的によって機器の構成や運用手法は異なる。「HPCクラスタ」(High Performance Computing cluster)はスーパーコンピュータなどの構成法の一つで、多数のノードを連結して並列処理を行わせることで一台の高性能コンピュータとして運用する方式である。

HAクラスタ」(High Availability cluster)は機器を複数用意することで可用性availability)を高める方式で、稼働中に一台が故障してもシステムを運用したまま交換することができる。

このうち、全ノードを同時に稼働させ処理を分散する構成を「アクティブ/アクティブ構成」あるいは「負荷分散クラスタ」、いずれか一系統を通常時の稼働系として停止時には待機系に即座に移行して稼働を続行する構成を「アクティブ/スタンバイ構成」あるいは「フェイルオーバークラスタ」という。

データクラスタリング

統計学などにおけるデータ解析手法の一つで、多数のデータ群を何らかの尺度に基づいて似た特徴を持つ集団に分類する手法を「データクラスタリング」(data clustering)あるいは「クラスター分析」(cluster analysis)というが、文脈によってはこれを略して単にクラスタリングということがある。

(2019.7.5更新)

他の辞典による解説 (外部サイト)

試験出題履歴

ITパスポート試験 : 令5 問70
この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。