オートエンコーダ【autoencoder】自己符号化器

概要

オートエンコーダとは、特殊なニューラルネットワークの構造の一つで、入力データを一度効率的な形式に圧縮し、そこから元のデータを再構成することを目的とするもの。主にデータ次元削減、特徴抽出、ノイズ除去、異常検知などに用いられる。
オートエンコーダのイメージ画像

入力層出力層の次元が同一で、中間層(隠れ層)を一層だけ持つシンプルなネットワークである。入力から潜在表現を生成する「エンコーダ」(encoder)、元のデータを復元して出力する「デコーダ」(decoder)を内蔵する。学習では、入力と出力が同一になるように誤差を最小化し、データの本質的な特徴を低次元の潜在空間に表現することを目指す。

学習によって調整されたパラメータとして表される潜在表現は、元の変数間の相関や構造を反映しており、データの背後にある重要な情報を抽出することができる。次元削減の線形的な手法である主成分分析を非線形に拡張したものとして理解することもできる。

オートエンコーダは教師なし学習分類され、ラベルを必要とせず大量のデータから特徴を学習できる。画像や音声など高次元データの前処理として用いられることが多い。正常なデータのみを学習させたオートエンコーダに異常なデータを入力した際、再構成誤差が大きくなることを利用して異常検知を行うといった用途もある。入力にノイズを加えて学習する「デノイジングオートエンコーダ」や、確率的な潜在変数を導入する「変分オートエンコーダ」など、目的に応じた拡張手法も提案されている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。