読み方 : グーグルネット
GoogLeNet【Inception v1】
概要
GoogLeNetとは、画像認識を行う畳み込みニューラルネットワークの一つ。画像認識コンテスト「ILSVRC」の2014年大会で優勝したモデルで、「Inception」(インセプション)と呼ばれる独自の構造を導入したことで知られる。

大きな特徴としてネットワーク内部にInceptionという独特なモジュールを組み込んでいる。これは、異なるサイズの畳み込みやプーリングを並列に配置し、それらの出力を結合する構造である。従来のモデルは層を直列に積み重ねるのが一般的だったが、GoogLeNetは一つの層の中で異なるサイズのフィルターを同時に適用することで画像内の多様な大きさの特徴を効率的に捉えることできる。
GoogLeNetは初期のモデルが22層と当時としては非常に深いネットワークである一方、全結合層をほとんど使用せず、グローバル平均プーリング(GAP)を採用している点も特徴である。これにより、過学習の抑制とモデルの軽量化が図られている。また、計算効率をさらに高めるために1×1のフィルタによる畳み込みを活用し、データの次元削減を行っている。
米グーグル(Google)社のチームが考案したモデルで、先行する「LeNet」を同社が改良したことにちなんだ命名である。名称は後に「Inception v1」に改められ、2017年の「Inception v4」までInception系モデルの改良が続いた。ネットワーク設計における効率性と表現力の両立という考え方を定着させる先駆けとなったモデルとして評価されている。