読み方 : ベータブイエーイー

β-VAE【β Variational Autoencoder】beta-VAE

概要

β-VAEとは、変分オートエンコーダVAE)の枠組みを拡張し、重み係数を一つ追加して潜在表現の性質を制御する生成モデル。表現の分離性や解釈性を高めることを目的としている。
β-VAEのイメージ画像

VAEオートエンコーダを拡張したニューラルネットワークの構造で、確率的な潜在変数モデルに基づいてデータの生成過程を学習することができる。従来のVAEでは、データの各特徴が潜在空間の異なる次元に混在してしまう「もつれ」(entanglement)が存在し、出力の解釈性が低く、特定の特徴だけ変更するといった制御も難しかった。

通常のVAEでは再構成誤差と潜在分布と事前分布の乖離を同時に最小化するが、β-VAEでは後者の項にβという係数(事前に決めておくハイパーパラメータ)を掛けて最適化を行う。βを1より大きく設定することで、潜在変数が事前分布により強く制約され、情報量が圧縮されやすくなる。

この結果、潜在空間の各次元がデータ生成要因を分担して表現する傾向が強まり、要因ごとに分離された表現が得られるようになる。例えば、物体の画像を学習させた場合、ある次元は「回転」、別の次元は「大きさ」といった、人間にとって解釈可能な独立した要素として抽出されるようになる。

一方で、βを大きくし過ぎると再構成精度が低下し、入力データの詳細が失われることがあるため、生成品質と表現の解釈性の間にはトレードオフが存在する。β-VAEは教師なし学習でありながらデータの構成要素を個別に制御・理解することができるため、画像生成の他にもロボット制御や異常検知など、現象の要因を解釈することが求められる分野に応用されている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。