読み方 : キャム

CAM【Class Activation Mapping】

概要

CAMとは、画像認識を行う畳み込みニューラルネットワークCNN)が注目した領域を可視化する手法。モデルの判断根拠となった場所を画像の上でヒートマップとして示し、説明可能性を向上させる。
CAMのイメージ画像

CNNの終盤層に、通常の全結合層に代えてグローバル平均プーリングGAP)層を導入する。GAPは各特徴マップ平均値を算出するものであり、これに各クラスへの寄与度を示す重みを掛け合わせることで、特定の物体に反応している領域を特定する。これにより、モデルが「犬」と判断した際に、画像内の犬の顔や体の部分が赤く強調された、直感的に理解しやすい可視化画像が得られる。

CAMを適用するためには、全結合層の代わりにGAP層を用いるなど特定のネットワーク構造が必要となる。この制約を緩和するため、既存モデルにも適用可能な「Grad-CAM」などの派生手法が提案されている。Grad-CAMでは、出力スコアに対する勾配情報を用いて特徴マップの重要度を算出するため、構造変更なしで多様な畳み込みネットワークに対応できる。

CAMによって、なぜその結論に至ったのかという根拠を人間が確認できるため、モデルの誤判定の原因究明や信頼性の評価が可能となる。これは医療診断や自動運転といった高い信頼性が求められる分野において特に重要な性質である。モデルが学習データ内の不適切なバイアスに依存していないかを検証するためにも活用されている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。