読み方 : はんきょうしありがくしゅう

半教師あり学習【semi-supervised learning】

概要

半教師あり学習とは、機械学習の手法の一つで、少量の正解ラベル付きデータと大量のラベルなしデータを併用して学習を行う方式。教師あり学習教師なし学習の中間的な手法で、教師データを用意するコストを抑えつつ予測精度の向上を図る。
半教師あり学習のイメージ画像

機械学習の方式のうち、人間が入力に対する「正解」を示すラベルを付けた学習データを利用して、正解を出力できるように学習させる方式を「教師あり学習」、そのようなラベルのない大量のデータをそのまま投入して内在するパターンなどを学習させる方式を「教師なし学習」という。

半教師あり学習では、限られたラベル付きデータによって正解についての傾向を学習したあと、大量のラベルなしデータを与えて精度を向上させる。その際、「似た性質を持つデータは同じラベルに属する」などいくつかの仮定を置いて、少数のラベル付きデータだけでは見えないデータの全体像を補完する。

教師あり学習で高精度なモデルを構築するためには多くのラベル付きデータが必要とされるが、ラベル付けの作業は原則として人間が行う必要があり、実務上はデータの収集やラベル付与に多大な時間やコストがかかる。半教師あり学習はラベル付きデータが少量でも、安価に用意できるラベルなしデータによって精度を向上させることができる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。