読み方 : かくちょうたたみこみ
拡張畳み込み【dilated convolution】膨張畳み込み
別名 :atrous convolution/アトラス畳み込み
概要

ニューラルネットワークの特殊な層の構造である「畳み込み層」は、脳の視覚野にある「単純型細胞」の働きを模したもので、画像のように空間構造を持つデータの中から局所的な特徴を抽出し、その位置を下層に伝える働きをする。
画像解析の場合、縦線、横線、曲線といった画像に含まれる断片的な小さな特徴に対応する「フィルタ」あるいは「カーネル」という小さな行列を用意し、これを画像の左上から右下へ一定の幅で移動しながら、各位置のデータ断片と照合する。全体をスキャンしたら、フィルタの特徴を発見した位置を並べた「特徴マップ」を作成し、下層へ出力する。
通常の畳み込み処理では隣接する領域に次のフィルタ照合を行うが、拡張畳み込みでは「膨張率」というハイパーパラメータで指定した間隔を空けて飛び飛びに照合する。例えば、膨張率が「1」の場合はフィルタの幅と同じだけ移動するため標準的な畳み込みと同じだが、膨張率を「2」や「3」に設定すると幅の2倍、3倍を一気に移動するため、広範囲の情報を一度に取り込めるようになる。
フィルタのサイズを拡大する必要がないため、通常の畳み込みからパラメータ数と計算量を増やさずに広範囲をカバーできるようになる。ただし、膨張率を過度に大きくすると入力空間を粗く、途切れ途切れにサンプリングする形となり、連続したパターンの把握が難しくなる場合がある。
(2025.12.5更新)