読み方 : ファスターアールシーエヌエヌ
Faster R-CNN【Faster Region-based Convolutional Neural Network】
概要
Faster R-CNNとは、畳み込みニューラルネットワークを用いて物体検出を行うR-CNNを改良したモデルの一つ。すべての処理を単一のニューラルネットワークで処理することで、学習と推論の両方で高速化を実現した。

元になったR-CNNは、畳み込みニューラルネットワーク(CNN)を用いて画像に写っている物体の種類と位置を特定するモデルである。物体が存在する位置の領域提案、各領域からの特徴量の抽出、物体のクラス分類と位置補正という三段階に分かれており、中間の特徴量の抽出にCNNを用いていた。
後継の「Fast R-CNN」では、特徴量の抽出を画像全体に対して一度だけ適用し、クラス分類と位置補正も同じCNNに統合するマルチタスク学習を行うことで、劇的な効率化と高速化を達成したが、領域提案だけは「選択的検索法」(selective search)など外部のアルゴリズムに頼っていた。
Faster R-CNNでは領域提案も統合するため、「RPN」(Region Proposal Network)と呼ばれる小規模なネットワークを導入し、この処理を学習可能な形でネットワーク内部に組み込んだ。RPNでは特徴マップ上をスライドしながら、あらかじめ定義された複数の「アンカーボックス」と呼ばれる基準枠に対して、物体の有無と位置補正量を同時に予測する。
物体検出に必要なすべての工程が一つのネットワークとして構築されているため、学習の効率も非常に高い。Faster R-CNNによって深層学習を用いた物体検出は速度と精度の両面で実用水準に到達し、自動運転や防犯システムなど様々な分野への応用が進んだ。