ドメインランダマイゼーション【domain randomization】
概要

ロボットやドローン、自動運転車など機械の物理的な制御を学習させる際、実機や実際の環境で学習を実施するとコストや所要時間、安全上の要請などが大きな制約となるため、シミュレータで仮想的な物理環境を用意してその中でモデルを学習させるという手法がよく用いられる。
しかし、学習済みのモデルを現実の環境に適用しようとすると、シミュレーションと現実世界の物理法則や視覚情報のわずかな差異によって性能が著しく低下する「リアリティギャップ」という問題が生じることがある。ドメインランダマイゼーションはこれを緩和するため、摩擦、重量、照明、テクスチャといった環境パラメータをランダムに変化させ、多様な現実へ適応できるようにする。
実環境を正確に再現する必要はなく、実環境が含まれると考えられる分布全体を覆うように条件をばらつかせる。学習モデルは、ランダムに生成された多数の環境に共通して成立する構造や規則性を捉えることになる。現実世界が学習中に経験した無数のバリエーションの一つとして映るように訓練し、複雑で予測困難なノイズに対しても高い堅牢性を発揮できるようになる。