プーリング【pooling】

畳み込み層で抽出された特徴マップを小さな領域ごとに分割し、その領域内の値を代表値に置き換える処理を行う。代表値の選出法としては、最大値を取る「最大プーリング」や、平均値を取る「平均プーリング」などがある。
例えば、2×2の領域に対して最大値プーリングを実施する場合、4つの画素の中から最も大きい値が出力され、その領域の情報を1つの値に集約する(他の画素の値は捨てられる)。こうして特徴マップの縦横のサイズがそれぞれ半分に縮小され、データの次元削減を効率よく行うことができる。
プーリングにより、対象パターンの位置のわずかなズレやノイズに対する耐性が向上する。画像中の対象物が少し移動しても、局所的な最大値や平均値は大きく変化しないため、CNNは特徴の存在を捉えやすくなる。これにより、学習が安定しやすく、過学習の抑制にも寄与する場合がある。
計算効率の面でもプーリングは有効とされる。特徴マップのサイズを縮小することで、後続の畳み込み層や全結合層で処理すべきデータ量が減少し、学習や推論にかかる計算時間を低減できる。また、縮小された特徴マップを用いることで、ネットワークのパラメータ数も抑制され、メモリ使用量の削減につながる。