読み方 : じょうたいひょうげんがくしゅう

状態表現学習【state representation learning】

概要

状態表現学習とは、高次元で複雑な観測データから、意思決定や予測に有用な低次元の表現を獲得する手法。強化学習などの効率を高めるための重要な前処理プロセスである。
状態表現学習のイメージ画像

例えば、現実世界のロボット制御や自動運転といった課題において、機械学習モデルが受け取るデータはカメラ画像のような膨大な画素情報であることが多い。しかし、画像に含まれるすべての画素が意思決定に不可欠なわけではなく、背景の細かな模様や照明の変化といったノイズも多く含まれている。

状態表現学習は、こうした冗長データの中から、視界内に存在する物体の種類や位置、速度といったタスク遂行に真に必要な要素のみを抽出し、ベクトル形式などコンパクトな表現に変換する。これにより、学習アルゴリズムは処理すべき情報量を大幅に削減でき、学習の収束速度や汎用性を向上させやすくなる。

具体的には、自己教師あり学習変分オートエンコーダなどがよく用いられる。例えば、現在の画像から次の瞬間の画像を予測するモデルを構築することで、環境の動的な変化を捉える特徴量を自然に獲得させる手法がある。明示的な正解ラベルを与えなくても、データの構造や物理的な制約から有用な情報を引き出すことができる。

適切な状態表現を獲得することは、未知の環境への適応能力にも影響する。一度優れた表現学習のモデルを構築できれば、異なる目的のタスクであっても、同じ特徴量を利用して効率的に学習を進めることができる。一方、どのような情報が「本質的」であるかは解くべき問題に依存するため、タスクの性質に応じた適切な損失関数の設計やアーキテクチャの選択が必要となる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。