読み方 : アレックスネット

AlexNet

概要

AlexNetとは、画像認識を行う畳み込みニューラルネットワークの一つ。画像認識コンテスト「ILSVRC」の2012年大会で優勝したモデルで、画像認識の主流が従来の機械学習手法から深層学習ディープラーニング)へ移行する契機となった。
AlexNetのイメージ画像

トロント大学のアレックス・クリジェフスキー(Alex Krizhevsky)、イリヤ・サツケバー(Ilya Sutskever)、ジェフェリー・ヒントン(Geoffrey E. Hinton)のチームが考案した。5層の畳み込み層と付随するいくつかのプーリング層、3層の全結合層を組み合わせた8層の畳み込みニューラルネットワークCNN)である。当時としては非常に深いネットワークであり、それまで主流だった手法を大きく上回る表現力を備えていた。

技術的な工夫として、活性化関数ReLUを採用し、学習の高速化と勾配消失の緩和が図られた。過学習を防ぐためにネットワークの一部をランダムに無効化するドロップアウトを導入し、大規模データに対する汎化性能が向上している。

膨大なパラメータの計算を高速化するために、3次元グラフィックス演算用のプロセッサであるGPUを複数用いて並列に計算を行う仕組みも組み込まれた。画像データを複数のGPUに分割して処理するアプローチは、その後の大規模なディープラーニング研究における標準的な計算手法の先駆けとなった。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。