エルマンネットワーク【Elman network】

概要

エルマンネットワークとは、リカレントニューラルネットワークRNN)の構造の一つで、過去の隠れ層の出力を、現在の入力に加えるもの。隠れ層の中間的な処理状態を保存して次の処理に反映させる構造で、文章の文脈を扱う自然言語処理などに適しているとされる。
エルマンネットワークのイメージ画像

通常のニューラルネットワーク入力層から出力層データが一方向的に流れるだけだが、RNNでは出力を次の入力へフィードバックするループ構造が組み込まれている。エルマンネットワークはこのうち、ある回の特定の隠れ層の出力を、入力層と並んだ「コンテキスト層」を通じて次の回の入力に加える。

RNNは時系列のデータを処理する際に過去の状態を短期的に記憶し、直前の状態や文脈に沿った出力を行うことができる。エルマンネットワークは中間状態を保存して次の処理に反映させる構造となっており、文章のように複数の要素が並んで意味を構成しているような入力を扱う際に、現在の文脈を保持する役割を果たす。

一方、特定の隠れ層の出力ではなく、最終的な出力をコンテキスト層を経由して次回の入力に加えるようなフィードバック機構を持つRNNを「ジョルダンネットワーク」という。前回の最終的な結果を今回の入力の一部として反映させるもので、ロボットの運動制御などに適しているとされる。

(2025.12.9更新)
この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。