読み方 : じょうたいひょうげんがくしゅう
状態表現学習【state representation learning】

例えば、現実世界のロボット制御や自動運転といった課題において、機械学習モデルが受け取るデータはカメラ画像のような膨大な画素情報であることが多い。しかし、画像に含まれるすべての画素が意思決定に不可欠なわけではなく、背景の細かな模様や照明の変化といったノイズも多く含まれている。
状態表現学習は、こうした冗長なデータの中から、視界内に存在する物体の種類や位置、速度といったタスク遂行に真に必要な要素のみを抽出し、ベクトル形式などコンパクトな表現に変換する。これにより、学習アルゴリズムは処理すべき情報量を大幅に削減でき、学習の収束速度や汎用性を向上させやすくなる。
具体的には、自己教師あり学習や変分オートエンコーダなどがよく用いられる。例えば、現在の画像から次の瞬間の画像を予測するモデルを構築することで、環境の動的な変化を捉える特徴量を自然に獲得させる手法がある。明示的な正解ラベルを与えなくても、データの構造や物理的な制約から有用な情報を引き出すことができる。
適切な状態表現を獲得することは、未知の環境への適応能力にも影響する。一度優れた表現学習のモデルを構築できれば、異なる目的のタスクであっても、同じ特徴量を利用して効率的に学習を進めることができる。一方、どのような情報が「本質的」であるかは解くべき問題に依存するため、タスクの性質に応じた適切な損失関数の設計やアーキテクチャの選択が必要となる。