読み方 : ノイジング

Noising

概要

Noisingとは、機械学習におけるデータ拡張手法の一つで、データに微小なノイズを意図的に付け加えて新たな学習データとするもの。入力データにランダムな変動を加えても正解ラベルが変わらないことを学習させ、予測精度を安定させることができる。
Noisingのイメージ画像

データ拡張機械学習に用いる学習データに加工を施して新しい学習データを生成する手法である。データの意味を保ったまま量や多様性を増やし、過学習を抑えて未知データに対する精度(汎化性能)を向上させる効果がある。

Noisingでは、学習データにランダムにノイズを付け加えたものを元の正解ラベルを用いて学習させる。例えば、画像であれば各画素に対してガウス分布に従う乱数であるガウスノイズを加えたものを学習させる。この手法は画像だけでなく、音声や文字データ、数値データなど様々なデータに対して汎用的に適用できる。

ノイズを加えたデータを学習することで入力の微小な揺らぎに対して頑健な表現を獲得し、モデルの汎化性能を高めることができる。特に、学習データ量が少ない場合、モデルはデータの細かな変動を重要な情報だと誤認して学習してしまう場合があるが、ノイズを導入することでこうした細部への依存を減らし、対象の普遍的な特徴を学ぶことができる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。