読み方 : キャム
CAM【Class Activation Mapping】
概要

CNNの終盤層に、通常の全結合層に代えてグローバル平均プーリング(GAP)層を導入する。GAPは各特徴マップの平均値を算出するものであり、これに各クラスへの寄与度を示す重みを掛け合わせることで、特定の物体に反応している領域を特定する。これにより、モデルが「犬」と判断した際に、画像内の犬の顔や体の部分が赤く強調された、直感的に理解しやすい可視化画像が得られる。
CAMを適用するためには、全結合層の代わりにGAP層を用いるなど特定のネットワーク構造が必要となる。この制約を緩和するため、既存モデルにも適用可能な「Grad-CAM」などの派生手法が提案されている。Grad-CAMでは、出力スコアに対する勾配情報を用いて特徴マップの重要度を算出するため、構造変更なしで多様な畳み込みネットワークに対応できる。
CAMによって、なぜその結論に至ったのかという根拠を人間が確認できるため、モデルの誤判定の原因究明や信頼性の評価が可能となる。これは医療診断や自動運転といった高い信頼性が求められる分野において特に重要な性質である。モデルが学習データ内の不適切なバイアスに依存していないかを検証するためにも活用されている。