読み方 : プーリングそう

プーリング層【pooling layer】

概要

プーリング層とは、畳み込みニューラルネットワークCNN)の持つ特殊な層の一つで、直前にある畳み込み層が出力した特徴マップを受け取って圧縮し、重要な特徴を抽出するもの。計算量を削減したり過学習を抑制する効果を持つ。
プーリング層のイメージ画像

CNNは画像の特徴などを捉えることができるネットワーク構造で、「畳み込み層」と呼ばれる特殊な層が用いられる。ここでは様々な断片的な特徴パターン(フィルタあるいはカーネルと呼ばれる)を画像の上で位置を少しずつずらしながら重ね合わせ、そのパターンが画像内のどこに存在するかを「特徴マップ」として出力する。

プーリング層は畳み込み層の直後に置かれる層で、畳み込み層が出力した特徴マップを受け取り、一定のルールに基づいてサイズを縮小する「ダウンサンプリング」(あるいはサブサンプリング)と呼ばれる処理を行う。これは、特徴マップの一定の範囲ごとに値を集計し、その領域の値を一つにまとめる処理である。範囲が2×2なら、特徴マップを2×2ずつに区切って一つの値に集約するため、重要な特徴を残しながらサイズを4分の1に減らすことができる。

特徴情報の集約の仕方には様々なものが提唱されている。最も基本的で代表的なものは「最大プーリング」と「平均プーリング」の2つである。最大プーリングは領域内の最大値を代表値として出力し、平均プーリングは領域内の値の平均を算出して代表値とする。

プーリング層は特徴マップのサイズを段階的に縮小することで、モデルのパラメータ数や計算負荷を抑えつつ、抽象度の高い特徴の形成を促す役割を果たす。入力の細かな位置の変化に影響されにくい表現を獲得する効果もある。プーリング層自体は学習によって調整されるパラメータ(重みやバイアスなど)を持たないことも特殊である。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。