オートエンコーダ【autoencoder】自己符号化器
概要

入力層と出力層の次元が同一で、中間層(隠れ層)を一層だけ持つシンプルなネットワークである。入力から潜在表現を生成する「エンコーダ」(encoder)、元のデータを復元して出力する「デコーダ」(decoder)を内蔵する。学習では、入力と出力が同一になるように誤差を最小化し、データの本質的な特徴を低次元の潜在空間に表現することを目指す。
学習によって調整されたパラメータとして表される潜在表現は、元の変数間の相関や構造を反映しており、データの背後にある重要な情報を抽出することができる。次元削減の線形的な手法である主成分分析を非線形に拡張したものとして理解することもできる。
オートエンコーダは教師なし学習に分類され、ラベルを必要とせず大量のデータから特徴を学習できる。画像や音声など高次元データの前処理として用いられることが多い。正常なデータのみを学習させたオートエンコーダに異常なデータを入力した際、再構成誤差が大きくなることを利用して異常検知を行うといった用途もある。入力にノイズを加えて学習する「デノイジングオートエンコーダ」や、確率的な潜在変数を導入する「変分オートエンコーダ」など、目的に応じた拡張手法も提案されている。