読み方 : シムトゥーリアル
Sim2Real【Simulation-to-Real】
概要

ロボットやドローン、自動運転車などの現実世界での学習には、物理的な故障のリスクや時間の制約、さらには膨大なデータの収集が困難であるという課題がある。シミュレータを用いた仮想環境内であれば、現実よりも高速に試行錯誤を繰り返すことが可能であり、安全かつ安価に多様な状況を経験させることができる。
しかし、シミュレーションは物理法則や細かな物理的な特性、センサーなどに生じるノイズ、環境の不確実性を完全には再現できず、学習したモデルをそのまま実機に適用すると性能が低下することが多い。このような仮想と現実の乖離は「リアリティギャップ」と呼ばれ、Sim2Realにおける主要な課題である。
この乖離を緩和する手法として「ドメインランダマイゼーション」(domain randomization)がよく知られる。これは、シミュレーション内の摩擦係数、物体の重さ、照明などの条件を意図的にランダムに変化させ、多様な環境下で学習させる手法である。モデルに環境の「揺らぎ」を経験させ、現実環境をその一例として包含することを目指す。これに、実世界で少量のデータを用いて学習済みモデルを調整するファインチューニングが併用されることも多い。
Sim2Realは単一のアルゴリズムを指すものではなく、シミュレーション設計、学習手法、実機適応を含む総合的な枠組みである。近年では、物理エンジンの高度化や表現学習の進展により、高度な器用さが求められるロボットハンドの操作や、複雑な地形を歩行する多脚ロボットの制御などが、現実での膨大な訓練なしに実現可能になってきている。