読み方 : カットミックス
CutMix
概要

データ拡張は機械学習に用いる学習データに加工を施して新しい学習データを生成する手法である。データの意味を保ったまま量や多様性を増やし、過学習を抑えて未知データに対する精度(汎化性能)を向上させる効果がある。
CutMixでは、一方の画像から矩形領域を切り取り、それを別の画像の対応する位置に貼り付けることで合成画像を作成する。同時に、元画像それぞれのラベルを、切り取った領域の面積比に応じて重み付けして混合する。モデルは画像の一部分だけでなく、複数の領域に含まれる特徴とラベルの関係を学習することになる。
画像から一部を切り抜いて欠落させるデータ拡張手法を「Cutout」、二つの画像を半透明にして重ね合わせて合成する手法を「Mixup」というが、CutMixは両者を組み合わせた手法と言える。画像の一部を欠落させることで局所的な特徴への過度な依存を抑え、より広い文脈を考慮した認識を促すとされる。