ディープニューラルネットワーク【DNN】Deep Neural Network/深層ニューラルネットワーク

概要

ディープニューラルネットワークとは、人間の脳神経回路を模した人工ニューラルネットワークにおいて、中間層を多数重ねた深い構造を持つモデルのこと。現代の実用的なAIシステムのほとんどで基盤となっている機械学習モデルである。
ディープニューラルネットワークのイメージ画像

人工ニューラルネットワークは、人間の脳の神経細胞(ニューロン)を模した多数のノードを層状に並べ、それらを結合して情報を伝達・変換する数理モデルである。基本的な構成は、データを受け取る「入力層」、結果を出力する「出力層」、その間に置かれる「中間層」(隠れ層)の三種類である。

初期の研究では中間層は1層だったが、効率的な学習手法の開発やコンピュータの計算能力の向上などにより複数の中間層が重なった構造が用いられるようになった。この中間層が複数積み重なった構造を「ディープ」(deep:深い)と表現し、そうしたネットワークを「ディープニューラルネットワーク」と呼ぶ。層の数はモデルによって異なるが、単純なもので数層、複雑なもので数百層以上に及ぶものも存在する。

各層のノードは前の層から受け取った値に重み付けを行い、活性化関数を通じて次の層へ値を渡す。学習の過程では、出力結果と正解データとの誤差を逆方向に伝播させる「誤差逆伝播法」(バックプロパゲーション)によって各結合の重みが繰り返し調整される。層を深くすることで、単純な特徴から複雑な特徴へと段階的に抽象化が進むため、浅いネットワークでは困難だった高度なパターン認識が可能になる。

ディープニューラルネットワークにはいくつかの代表的な派生構造がある。画像認識に強みを持つ「CNN」(畳み込みニューラルネットワーク)、時系列データ自然言語の処理に用いられる「RNN」(リカレントニューラルネットワーク)、現在の大規模言語モデルLLM)の基盤となっている「Transformer」などがよく知られる。これらは、いずれも多層構造を前提とした設計であり、ディープニューラルネットワークの一形態である。

ディープニューラルネットワークの実用化にあたっては、大量の学習データGPUなどによる高い計算能力が必要となる。2010年代以降、これらの条件が整ったことで画像認識音声認識自然言語処理などの分野で飛躍的な性能向上が実現し、現在のAI技術の中核を担う手法となっている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。