読み方 : ブイジージー

VGG【Visual Geometry Group】

概要

VGGとは、画像認識を行う畳み込みニューラルネットワークの一つ。画像認識コンテスト「ILSVRC」の2014年大会で準優勝したモデルで、画像認識の主流が従来の機械学習手法から深層学習ディープラーニング)へ移行する契機となった。
VGGのイメージ画像

英オックスフォード大学のVisual Geometry Groupが考案したモデルで、グループ名がそのままモデル名となっている。3×3という一種類の小さなフィルタのみを用いる畳み込みニューラルネットワークCNN)で、これを何層も深く重ねる構成となっている。小さなフィルタを重ねることで大きなフィルタと同じ受容野を確保しながら、より複雑な特徴を抽出できる。

初期に提案されたのは畳み込み層13層と付随するプーリング層、3層の全結合層で16層の「VGG16」だが、後に19層に拡張した「VGG19」などの派生モデルも提案された。構造が単純で規則的であるため、プログラムでの実装が容易であり、画像から汎用的な特徴を抽出するためのベースモデルとして長らく標準的に利用されてきた。一方、全結合層を含めたパラメータ数が非常に多く、計算量やメモリ消費が大きい難点がある。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。