読み方 : エフピーエヌ
FPN【Feature Pyramid Network】
概要
FPNとは、ニューラルネットワークの構造の一つで、画像中の異なる大きさの物体を効率よく検出するための手法。畳み込み層が持つ階層構造を利用して、解像度と情報の豊かさを両立させた特徴マップを生成することができる。

画像認識などに用いられる畳み込みニューラルネットワーク(CNN)では、層が深くなるにつれて空間解像度は低下する一方、意味的に抽象度の高い特徴が得られるという性質がある。浅い層は小さな物体の位置情報を保持しやすく、深い層は物体の種類を識別する能力に優れるが、単一の層だけでは様々なスケールの物体を扱うことが難しかった。
FPNでは通常の解像度が下がっていく「ボトムアップ」の経路に加えて、深い層の情報を元の解像度側へ引き戻す「トップダウン」の経路を導入し、対応する層同士を横方向の接続によって結合する。ネットワーク内部に特徴マップのピラミッド構造(特徴ピラミッド)を構築し、サイズの異なる物体をそれぞれの大きさに適した階層の特徴マップで検出する。
生成された各スケールの特徴マップは、物体検出やセグメンテーションなどの下流タスクに利用され、特に小さな物体の検出精度の向上に寄与するとされる。Faster R-CNNやMask R-CNNなどの既存のモデルと組み合わせて利用することが可能であり、標準的な手法の一つとして広く採用されている。