読み方 : ランドオーグメント
RandAugment
概要

データ拡張は機械学習に用いる学習データに加工を施して新しい学習データを生成する手法である。データの意味を保ったまま量や多様性を増やし、過学習を抑えて未知データに対する精度(汎化性能)を向上させる効果がある。
RandAugmentは画像データに対するデータ拡張を自動化するアルゴリズムの一つで、操作の種類nと強度mという二つのパラメータで制御される。あらかじめ用意された拡張手法からn種類の手法をランダムに選択し、同じ強度mで順番に元の画像データに対して適用したものを新たな学習データとする。
適用される操作には、回転(Rotation)や反転(Flip)といった幾何変換、明るさ(Brightness)やコントラスト(Contrast)の変更、色相の調整などが含まれる。これらは画像の意味内容を大きく変えずに見え方のみを変化させる処理であり、モデルに対して入力の多様な変動を経験させる役割を持つ。
先行するAutoAugmentのような探索型手法は膨大な計算資源が必要な難点があった。RandAugmentは操作の種類を10個程度、強度を10段階程度用意することが多く、パラメータの探索空間が100種類程度しかないため、計算コストが圧倒的に低いという利点がある。実際のデータを用いた実験では、シンプルながら既存手法に比べ遜色ない精度の向上が得られるとされる。