プーリング【pooling】

概要

プーリングとは、畳み込みニューラルネットワークCNN)において、特徴マップの空間的サイズを縮小し、重要な情報を抽出する操作。入力データ解像度を下げつつ、計算量を抑える効果がある。
プーリングのイメージ画像

畳み込み層で抽出された特徴マップを小さな領域ごとに分割し、その領域内の値を代表値に置き換える処理を行う。代表値の選出法としては、最大値を取る「最大プーリング」や、平均値を取る「平均プーリング」などがある。

例えば、2×2の領域に対して最大値プーリングを実施する場合、4つの画素の中から最も大きい値が出力され、その領域の情報を1つの値に集約する(他の画素の値は捨てられる)。こうして特徴マップの縦横のサイズがそれぞれ半分に縮小され、データ次元削減を効率よく行うことができる。

プーリングにより、対象パターンの位置のわずかなズレやノイズに対する耐性が向上する。画像中の対象物が少し移動しても、局所的な最大値や平均値は大きく変化しないため、CNNは特徴の存在を捉えやすくなる。これにより、学習が安定しやすく、過学習の抑制にも寄与する場合がある。

計算効率の面でもプーリングは有効とされる。特徴マップのサイズを縮小することで、後続の畳み込み層や全結合層で処理すべきデータ量が減少し、学習や推論にかかる計算時間を低減できる。また、縮小された特徴マップを用いることで、ネットワークパラメータ数も抑制され、メモリ使用量の削減につながる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。