読み方 : カットミックス

CutMix

概要

CutMixとは、機械学習におけるデータ拡張手法の一つで、二つの画像データを切り貼りして合成した画像を学習データとするもの。混合した画像の面積比率に応じて正解ラベルも混合することで、モデルの識別能力と汎用性を高めることができる。
CutMixのイメージ画像

データ拡張機械学習に用いる学習データに加工を施して新しい学習データを生成する手法である。データの意味を保ったまま量や多様性を増やし、過学習を抑えて未知データに対する精度(汎化性能)を向上させる効果がある。

CutMixでは、一方の画像から矩形領域を切り取り、それを別の画像の対応する位置に貼り付けることで合成画像を作成する。同時に、元画像それぞれのラベルを、切り取った領域の面積比に応じて重み付けして混合する。モデルは画像の一部分だけでなく、複数の領域に含まれる特徴とラベルの関係を学習することになる。

画像から一部を切り抜いて欠落させるデータ拡張手法を「Cutout」、二つの画像を半透明にして重ね合わせて合成する手法を「Mixup」というが、CutMixは両者を組み合わせた手法と言える。画像の一部を欠落させることで局所的な特徴への過度な依存を抑え、より広い文脈を考慮した認識を促すとされる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。