読み方 : インフォブイエーイー
InfoVAE【Information Maximizing Variational Autoencoder】
概要

VAEはオートエンコーダを拡張したニューラルネットワークの構造で、確率的な潜在変数モデルに基づいてデータの生成過程を学習することができる。従来のVAEでは、潜在変数が事前分布に過度に近づくことで、入力データの情報が十分に保持されない現象が指摘されてきた。
InfoVAEはこの問題に対応するため、潜在変数と入力データの間の相互情報量を学習目標に明示的に組み込み、これを最大化するように設計されている。これにより、潜在表現がデータの構造や多様性をより豊かに反映することが期待される。
学習では、再構成誤差に加えて、潜在分布と事前分布の乖離を測る項や相互情報量に関する項が導入され、それぞれの重み付けを調整することで、生成品質と表現力のバランスが制御される。画像生成や表現学習において、潜在空間の崩壊を抑えつつ多様なサンプルを生成できる。