読み方 : ブイジージー
VGG【Visual Geometry Group】
概要

英オックスフォード大学のVisual Geometry Groupが考案したモデルで、グループ名がそのままモデル名となっている。3×3という一種類の小さなフィルタのみを用いる畳み込みニューラルネットワーク(CNN)で、これを何層も深く重ねる構成となっている。小さなフィルタを重ねることで大きなフィルタと同じ受容野を確保しながら、より複雑な特徴を抽出できる。
初期に提案されたのは畳み込み層13層と付随するプーリング層、3層の全結合層で16層の「VGG16」だが、後に19層に拡張した「VGG19」などの派生モデルも提案された。構造が単純で規則的であるため、プログラムでの実装が容易であり、画像から汎用的な特徴を抽出するためのベースモデルとして長らく標準的に利用されてきた。一方、全結合層を含めたパラメータ数が非常に多く、計算量やメモリ消費が大きい難点がある。