読み方 : エスイーネット

SENet【Squeeze-and-Excitation Network】

概要

SENetとは、画像認識を行う畳み込みニューラルネットワークの一つ。画像のチャネル間の関係性に注目し、重要な特徴を強調して不要な情報を抑制する仕組みを導入したモデル。既存のモデルに容易に追加できる汎用性の高い仕組みである。
SENetのイメージ画像

従来の畳み込みニューラルネットワークCNN)は、空間的な情報の抽出には長けていたが、各画素の赤・青・緑といったチャネルが持つ情報の重要度については一律に扱っていた。SENetでは、“Squeeze-and-Excitation” と呼ばれる一種の注意機構(Attention)を組み込み、チャネルごとの重要度を学習によって調整する。

まず「Squeeze」(絞り出し)段階では、空間方向に対するグローバル平均プーリングGAP)を用いて各チャネルを単一の統計量に要約し、特徴マップ全体の情報を集約する。次に「Excitation」(興奮)段階では、この要約情報を全結合層を含む小規模なネットワークに入力し、チャネルごとの重みを算出する。

得られた重みは0から1の範囲で出力され、元の特徴マップに乗算される。これにより、重要なチャネルは強調され、寄与の小さいチャネルは抑制される。この処理は畳み込み演算そのものを変更するものではなく、既存のResNetやInception(GoogLeNet)といった多様なネットワーク構造に「SEブロック」として容易に組み込むことができる。ネットワークの深さや幅だけでなく、チャネル間の自己注意(Self-Attention)という新たな設計視点を確立した。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。