教師あり学習 【supervised learning】
学習データが「例題と答え」という形式に整理されており、例題を入力すると対応する答えを出力するようにモデルを訓練していく。答え(出力)がラベルや離散値であるようなデータを用いれば分類問題に、実数などの連続値を取るようなデータを用いれば予測や推論を行うための回帰問題に適用できる。
例えば、数字を手書きした画像(例題)と、写っている数字(答え)をペアにした教師データをたくさん用意し、画像を入力すると数字を答えるモデルを作成すると、手書きの数字を認識するシステムを作ることができる。
人間が既に答えを知っているような判断や作業を自動化したい場合に有効な手法で、様々な分野で応用が広がっている。学習効率も高く精度も向上させやすいが、生のデータを「例題と答えのペア」という形式に整理しなければならず、学習データの質や潜在的な問題点がそのまま精度や結果に反映されてしまう難点もある。
一方、人間があらかじめ正解を示さずにデータを与え、似た特徴のデータに分類する(クラスタリング)といった処理を行えるようにする手法を「教師なし学習」(unsupervised learning)、決まった正解は存在しないが出力結果に対する評価は存在し、好ましい評価を得るために出力を調整していく手法を「強化学習」(reinforcement learning)という。
(2021.9.16更新)