読み方 : せきそうオートエンコーダ
積層オートエンコーダ【stacked autoencoder】
概要
積層オートエンコーダとは、特殊なニューラルネットワークの構造の一つで、複数のオートエンコーダを層状に重ねて構成したもの。単層のモデルでは捉えきれないデータの抽象的な構造を学習でき、深層学習(ディープラーニング)の先駆け的な技術として知られる。

入力層と出力層の次元が同一で、一層のみの中間層(隠れ層)で情報を圧縮するネットワーク構造を「オートエンコーダ」(autoencoder)という。積層オートエンコーダは複数のオートエンコーダを階層状に積み重ねたもので、入力側のオートエンコーダで得られる潜在表現を次のオートエンコーダの入力とし、これを繰り返すことで多層構造を形成する。
下位層では入力データの局所的・低水準な特徴が学習され、上位層に進むにつれてより抽象度の高い表現が獲得される。この構造により、ネットワークの深い層へ行くほど入力に含まれる細かな変動が取り除かれ、より本質的で高度な概念が抽出されるようになる。
隠れ層が複数ある深い階層のニューラルネットワークは、一度に全体を学習させようとすると計算量が膨大になる問題があり、一時は研究が停滞していたが、積層オートエンコーダでは入力側から一層ずつ順番に学習していく「事前学習」(pretraining)という手法が導入され、深い階層でも現実的な計算量で学習可能になった。
すべての層の学習が完了した後は、デコーダ部分を取り除き、最後に分類用の層を追加してネットワーク全体を微調整する「ファインチューニング」を行う。近年では、計算能力の向上や学習アルゴリズムの改良により、オートエンコーダを用いない直接的な深層学習が一般的となったが、積層オートエンコーダは深い階層の学習を効率的に進める手法の先駆けとして歴史的な意義がある。