データマイニング 【data mining】

概要

データマイニング(data mining)とは、蓄積された大量のデータを統計学や数理解析などの技法を用いて分析し、これまで知られていなかった規則性や傾向など、何らかの未知の有用な知見を得ること。
データマイニングのイメージ画像

解説 「マイニング」(mining)とは「採掘」の意味で、膨大なデータの集積を鉱山に、そこから有用な知見を見出すことを資源の採掘になぞらえている。適用分野や目的、対象となるデータの種類は多種多様だが、ビジネスの分野では企業が業務に関連して記録したデータ(過去の取引記録、行動履歴など)を元に、意思決定や計画立案、販売促進などに有効な知見を得るために行われることが多い。

例えば、小売店の商品の売上データの履歴は、それ自体は会計上の手続きや監査などの業務にしか使われないが、データマイニングの手法で統計的に処理することで、これまで知られていなかった「商品Aと商品Bを一緒に購入する顧客が多い」といった傾向が分かる場合がある。これにより、AとBの売り場を統合するといった販売促進施策を行うことが可能となる。

商業分野だけでなく、自然言語処理やパターン認識、人工知能などの研究などでも利用される。分析・解析の手法も様々だが、代表的な手法としては、頻度の高いパターンの抽出や、相関関係にある項目の組の発見、データの特徴や共通点に基づく分類、過去の傾向に基づく将来の予測などがある。

近年では、一般的なシステムやソフトウェアでの解析が困難な巨大なデータセットである「ビッグデータ」を対象とした解析手法や、人工知能の一分野である機械学習、特に先進的な手法である「ディープラーニング」を応用したマイニング手法などが活発に研究・開発されている。

(2024.1.16更新)

他の用語辞典による「データマイニング」の解説 (外部サイト)

資格試験などの「データマイニング」の出題履歴

▼ ITパスポート試験
平28秋 問27】 蓄積された販売データなどから、天候と売れ筋商品の関連性などの規則性を見つけ出す手法を表す用語はどれか。
平24秋 問5】 経営判断や業務遂行などに活用するために、データベースに蓄積された顧客の購買履歴などのデータを分析して、有用な情報を抽出する手法はどれか。
平24春 問27】 事業活動に関する大量の情報を収集し、分析して、事業の意思決定や業務遂行に活用する能力を育成したい。このとき、実施する研修のテーマとして、最も適切なものはどれか。
平23春 問9】 データマイニングの事例として、適切なものはどれか。
平21秋 問4】 データマイニングとは、データベースに蓄積されている大量の生データに対し、統計やパターン認識などの手法を用いることによって、認識されていなかった規則性や関係性を導き出す技術である。

▼ 基本情報技術者試験
令3修7 問29】 ビッグデータの活用例として,大量のデータから統計学的手法などを用いて新たな知識(傾向やパターン)を見つけ出すプロセスはどれか。
令1修6 問30】 ビッグデータの活用例として,大量のデータから統計学的手法などを用いて新たな知識(傾向やパターン)を見つけ出すプロセスはどれか。
平30修7 問64】 企業が保有する顧客や市場などの膨大なデータから,有用な情報や関係を見つけ出す手法はどれか。
平29春 問29】 ビッグデータの活用例として,大量のデータから統計学的手法などを用いて新たな知識(傾向やパターン)を見つけ出すプロセスはどれか。
平29修1 問64】 企業が保有する顧客や市場などの膨大なデータから,有用な情報や関係を見つけ出す手法はどれか。
平27秋 問64】 企業が保有する顧客や市場などの膨大なデータから,有用な情報や関係を見つけ出す手法はどれか。
平26修6 問64】 企業が保有する顧客や市場などの膨大なデータから,有用な情報や関係を見つけ出す手法はどれか。
平25修7 問34】 大量に蓄積されたデータから,ビジネスなどに有効な情報を統計学的手法などを用いて新たに見つけ出すプロセスはどれか。
平24春 問64】 企業が保有する顧客や市場などの膨大なデータから,有用な情報や関係を見つけ出す手法はどれか。
平23修7 問70】 データマイニングとは,データベースに蓄積されている大量の生データに対し,統計やパターン認識などの手法を用いることによって,認識されていなかった規則性や関係性を導き出す技術である。
平23修6 問35】 大量に蓄積されたデータから,ビジネスなどに有効な情報を統計学的手法などを用いて新たに見つけ出すプロセスはどれか。
平22修6 問35】 大量に蓄積されたデータから,ビジネスなどに有効な情報を統計学的手法などを用いて新たに見つけ出すプロセスはどれか。