読み方 : アレックスネット
AlexNet
概要

トロント大学のアレックス・クリジェフスキー(Alex Krizhevsky)、イリヤ・サツケバー(Ilya Sutskever)、ジェフェリー・ヒントン(Geoffrey E. Hinton)のチームが考案した。5層の畳み込み層と付随するいくつかのプーリング層、3層の全結合層を組み合わせた8層の畳み込みニューラルネットワーク(CNN)である。当時としては非常に深いネットワークであり、それまで主流だった手法を大きく上回る表現力を備えていた。
技術的な工夫として、活性化関数にReLUを採用し、学習の高速化と勾配消失の緩和が図られた。過学習を防ぐためにネットワークの一部をランダムに無効化するドロップアウトを導入し、大規模データに対する汎化性能が向上している。
膨大なパラメータの計算を高速化するために、3次元グラフィックス演算用のプロセッサであるGPUを複数用いて並列に計算を行う仕組みも組み込まれた。画像データを複数のGPUに分割して処理するアプローチは、その後の大規模なディープラーニング研究における標準的な計算手法の先駆けとなった。