教師なし学習 【unsupervised learning】

概要

教師なし学習(unsupervised learning)とは、機械学習の手法の一つで、人間が基準や正解を与えずに学習データを分析させ、システムが自律的に何らかの規則性や傾向を見出す手法。

与えられたデータ群を何らかの目的をもって解析し、特徴の似たデータのグループ分けなどを行えるようにする。人間が示した基準に従っているわけではないため、得られた結果が何を意味するかは人間の解釈を必要とする。

具体的な手法としては、データ群を似た特徴の集団に分類する「クラスター分析」(データクラスタリング)、多数の説明変数を要約して少ない変数で同じ傾向を説明できるようにする「主成分分析」、複数の項目間に潜在する関連性を見つけ出す「アソシエーション分析」などがある。

人間にも正解が分からない課題についての知見を得たい場合や、大量のデータから規則性を探索したい場合などに有効な手法で、データの前処理が少なく現実世界にある多様な大量のデータを素材にできる反面、人間にとって有用な結果が得られるよう制御するのが難しく精度も安定させにくいなどの課題がある。

一方、人間があらかじめ「例題と正解のペア」という形式に整理した学習データ(教師データ)を利用してモデルを訓練する手法を「教師あり学習」(supervised learning)、決まった正解は存在しないが出力結果に対する評価は存在し、好ましい評価を得るために出力を調整していく手法を「強化学習」(reinforcement learning)という。

(2021.9.16更新)

他の辞典による解説 (外部サイト)

試験出題履歴

ITパスポート試験 : 令6 問65
この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。