読み方 : かくちょうたたみこみ

拡張畳み込み【dilated convolution】膨張畳み込み

別名  :atrous convolution/アトラス畳み込み

概要

拡張畳み込みとは、畳み込みニューラルネットワークCNN)でフィルタによる特徴抽出を行う際、一定の間隔を開けて移動させる畳み込み手法。パラメータ数を増やさずに受容野を拡大できる。
拡張畳み込みのイメージ画像

ニューラルネットワークの特殊な層の構造である「畳み込み層」は、脳の視覚野にある「単純型細胞」の働きを模したもので、画像のように空間構造を持つデータの中から局所的な特徴を抽出し、その位置を下層に伝える働きをする。

画像解析の場合、縦線、横線、曲線といった画像に含まれる断片的な小さな特徴に対応する「フィルタ」あるいは「カーネル」という小さな行列を用意し、これを画像の左上から右下へ一定の幅で移動しながら、各位置のデータ断片と照合する。全体をスキャンしたら、フィルタの特徴を発見した位置を並べた「特徴マップ」を作成し、下層へ出力する。

通常の畳み込み処理では隣接する領域に次のフィルタ照合を行うが、拡張畳み込みでは「膨張率」というハイパーパラメータで指定した間隔を空けて飛び飛びに照合する。例えば、膨張率が「1」の場合はフィルタの幅と同じだけ移動するため標準的な畳み込みと同じだが、膨張率を「2」や「3」に設定すると幅の2倍、3倍を一気に移動するため、広範囲の情報を一度に取り込めるようになる。

フィルタのサイズを拡大する必要がないため、通常の畳み込みからパラメータ数と計算量を増やさずに広範囲をカバーできるようになる。ただし、膨張率を過度に大きくすると入力空間を粗く、途切れ途切れにサンプリングする形となり、連続したパターンの把握が難しくなる場合がある。

(2025.12.5更新)
この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。