読み方:ルネット
LeNet
それまでの、単純に全結合層が重なったニューラルネットワークと異なり、入力データから断片的な特徴を捉えるための「畳み込み層」を組み込んだ構造となっている。畳み込み層の下には特徴情報に一定の演算を行ってサイズを縮小する「プーリング層」を重ねている。
初期の「LeNet-1」から何度も改良が繰り返され、複数の異なる構造のモデルがある。1998年に開発された最も有名な「LeNet-5」の場合、上位層側に畳み込み層とプーリング層のセットが2つ重なり、その下に3つの全結合層を重ね、全体で7層の深層ニューラルネットワーク(DNN)となっている。パラメータ数は約6万だった。
LeNetは手書きの数字を認識する用途に訓練され、数字の画像を与えると0から9の数字を回答した。1998年のテストでは他のどの方式よりもLeNet-5の精度が高く、AI研究者の中で畳み込みニューラルネットワークの有用性が広く知られることとなった。LeNetは実際に銀行の小切手読み取りシステムに組み込まれ、金額の自動読み取りに貢献した。
(2025.9.12更新)