読み方 : グーグルネット

GoogLeNet【Inception v1】

概要

GoogLeNetとは、画像認識を行う畳み込みニューラルネットワークの一つ。画像認識コンテスト「ILSVRC」の2014年大会で優勝したモデルで、「Inception」(インセプション)と呼ばれる独自の構造を導入したことで知られる。
GoogLeNetのイメージ画像

大きな特徴としてネットワーク内部にInceptionという独特なモジュールを組み込んでいる。これは、異なるサイズの畳み込みやプーリングを並列に配置し、それらの出力を結合する構造である。従来のモデルは層を直列に積み重ねるのが一般的だったが、GoogLeNetは一つの層の中で異なるサイズのフィルターを同時に適用することで画像内の多様な大きさの特徴を効率的に捉えることできる。

GoogLeNetは初期のモデルが22層と当時としては非常に深いネットワークである一方、全結合層をほとんど使用せず、グローバル平均プーリングGAP)を採用している点も特徴である。これにより、過学習の抑制とモデルの軽量化が図られている。また、計算効率をさらに高めるために1×1のフィルタによる畳み込みを活用し、データ次元削減を行っている。

米グーグル(Google)社のチームが考案したモデルで、先行する「LeNet」を同社が改良したことにちなんだ命名である。名称は後に「Inception v1」に改められ、2017年の「Inception v4」までInception系モデルの改良が続いた。ネットワーク設計における効率性と表現力の両立という考え方を定着させる先駆けとなったモデルとして評価されている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。