読み方 : たたみこみそう
畳み込み層【convolutional layer】
概要

ニューラルネットワークでは層状に重なったノード群が入力データから特徴を抽出してパラメータとして記録していく。一般的なモデルでは、上層のすべてのノードが下層のすべてのノードに接続された「全結合層」を用いるが、データ全体の特徴を均等に扱うため、画像の部分的な特徴を捉えるといった機能を実装することは難しい。
畳み込み層はノード間の接続が制限された層で、様々なパターンの局所的な特徴を表すノード群で構成される。各ノード群は捉えた特徴を後続のプーリング層へ送る。畳み込み層を含むモデルを「畳み込みニューラルネットワーク」(CNN:Convolutional Neural Network)という。
畳み込み層は脳の視覚野にある「単純型細胞」の働きを模したもので、縦線、横線、曲線といった画像に含まれる断片的な小さな特徴を検知して下層のノードへ伝達する。特徴は「フィルタ」あるいは「カーネル」と呼ばれる小さな行列で表現され、画像のどの位置にどの特徴があるかを示す「特徴マップ」が下層へ送られる。
プーリング層は脳の視覚野にある「複雑型細胞」の働きを模したもので、畳み込み層から得た特徴マップに一定の演算を行ってサイズを縮小する。畳み込み層とプーリング層は交互に何段階か重ね、下層へ行くほど小さな特徴を組み合わせた、より大きな特徴を捉える。最下層に全結合層を置き、様々な特徴の情報を流し込んで総合的な分類や予測などを行う。