読み方 : はんきょうしありがくしゅう
半教師あり学習【semi-supervised learning】
概要

機械学習の方式のうち、人間が入力に対する「正解」を示すラベルを付けた学習データを利用して、正解を出力できるように学習させる方式を「教師あり学習」、そのようなラベルのない大量のデータをそのまま投入して内在するパターンなどを学習させる方式を「教師なし学習」という。
半教師あり学習では、限られたラベル付きデータによって正解についての傾向を学習したあと、大量のラベルなしデータを与えて精度を向上させる。その際、「似た性質を持つデータは同じラベルに属する」などいくつかの仮定を置いて、少数のラベル付きデータだけでは見えないデータの全体像を補完する。
教師あり学習で高精度なモデルを構築するためには多くのラベル付きデータが必要とされるが、ラベル付けの作業は原則として人間が行う必要があり、実務上はデータの収集やラベル付与に多大な時間やコストがかかる。半教師あり学習はラベル付きデータが少量でも、安価に用意できるラベルなしデータによって精度を向上させることができる。