読み方 : グローバルへいきんプーリング
グローバル平均プーリング【GAP】Global Average Pooling
別名 :グローバルアベレージプーリング/全体平均プーリング
概要

CNNは画像の特徴などを捉えることができるネットワーク構造で、「畳み込み層」と、その直後に置かれる「プーリング層」と呼ばれる特殊な層が用いられる。畳み込み層では様々な断片的な特徴パターン(フィルタあるいはカーネルと呼ばれる)を画像の上で位置を少しずつずらしながら重ね合わせ、そのパターンが画像内のどこに存在するかを「特徴マップ」として出力する。
プーリング層は畳み込み層が出力した特徴マップを受け取り、一定のルールに基づいてサイズを縮小する「ダウンサンプリング」(あるいはサブサンプリング)と呼ばれる処理を行う。これは、特徴マップの一定の範囲ごとに値を集計し、その領域の値を一つにまとめる処理である。グローバル平均プーリングは特徴マップのすべての値を平均して一つの値に集約する。上層の畳み込み層の各チャネルが出力するマップを、単一の値が並んだベクトルに変換する。
従来のCNN終盤層では、最後の畳み込み層が出力した特徴マップ群を全結合層に与えて外部へ出力するデータに整形していたが、重みの数が多く学習に時間や計算量を多く費やす難点があった。グローバル平均プーリングはこの最後の全結合層の代わりに用いる処理で、最後の畳み込み層が表す抽象的な特徴群が画像全体でどのくらい出現するかを特徴ごとに単一の値で表現する。
グローバル平均プーリングの結果は特徴の出現頻度を表す値を並べたベクトルであるため全結合層の出力よりも解釈性が高い。また、プーリング層は学習で調整する重みなどのパラメータを持たず、常に固定的な処理をするため、従来の全結合層の学習プロセスをすべて省略して学習を効率化できる。パラメータが減ることで過学習を起こしにくいという利点もある。
(2025.12.8更新)