読み方 : カットアウト
Cutout
概要

データ拡張は機械学習に用いる学習データに加工を施して新しい学習データを生成する手法である。データの意味を保ったまま量や多様性を増やし、過学習を抑えて未知データに対する精度(汎化性能)を向上させる効果がある。
Cutoutでは、元の画像の一部をランダムなサイズの矩形(長方形や正方形)で単色に塗りつぶすなどして、対象の一部が隠れて見えないように加工する。様々な箇所が隠れた画像で繰り返し学習を行うことで、モデルは特定の局所的な特徴だけに依存することなく、画像全体の文脈や複数の特徴を組み合わせて判断するよう促される。
単一の画像でデータを拡張することができ、ラベルの変更も必要なく、加工も容易であるため、画像認識などのモデルを作成する際に低コストで汎化性能を高める手法として普及している。欠損した箇所に別の画像から切り抜いたイメージを貼り付けて合成する手法も提案されており「CutMix」と呼ばれる。