学習曲線 【learning curve】 ラーニングカーブ

概要

学習曲線(learning curve)とは、学習や訓練に費やした労力(時間や試行回数など)と、対象とする知識や能力の獲得、習熟度合いの関係を図示したグラフ。

一般的には縦軸に習熟度や達成度、横軸に累積の学習時間や練習量などを取り、原点付近から時間経過に伴って能力が右上に向かって向上していく様子を描く。

学習対象や学習方法、学習者の能力や個性などに応じて曲線の形は異なる。よく見られるのは、初期には成果が挙がらずなだらかだが、次第に急激に結果が向上し、やがて限界に近づき停滞する「S」の字型の経過である。

経営などの分野では、生産現場などで反復してう作業などについて、作業者が熟練するに従って所要時間などが減っていく様子を表したものを学習曲線ということがある。縦軸に所要時間、横軸に累積の作業量や練習量などを取ると、初期には急激に、次第に緩やかに減少していき一定の時間に収束していく曲線が描かれる。

機械学習の学習曲線

機械学習MLMachine Learning)の分野では、予測モデルに与える学習データの量と予測精度(正解率)の関係を図示したものを学習曲線という。

同じモデルを表す学習データと検証データを用意(学習データを分割して一部を検証データとすることが多い)し、学習データのサンプルを増やしていきながら、学習データを用いた予測精度、検証データを用いた予測精度の2本の曲線を描く。

一般に、サンプルが少ない初期の状態では学習データを丸ごと反映したモデルが作成されるため、学習データでの予測は満点に近い一方、データから特徴や傾向を学んだわけではないため、未知の検証データでの予測はほとんどできない、両者の精度が大きく乖離した状態となる。

サンプルを増やしていくと、学習データをすべて「暗記」したようなモデルは作れなくなっていくため、学習データによる予測精度は徐々に下降していく一方、モデルに傾向が反映されるため検証データによる予測精度は向上していく。最適なモデルでは両者の精度が近いに漸近していくような形状となる。

一方、両者の乖離が大きいままで、学習データの精度は高止まり、検証データの精度は一向に向上しない場合には、学習データに対する過学習過剰適合)を起こしていることが示唆される。また、いずれの精度も低いまま収束していってしまっている場合はモデルやデータに不備があり学習不足となっている可能性が高い。

(2021.12.14更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる