読み方 : ファストアールシーエヌエヌ
Fast R-CNN【Fast Region-based Convolutional Neural Network】
概要
Fast R-CNNとは、畳み込みニューラルネットワークを用いて物体検出を行うR-CNNを改良したモデルの一つ。画像全体に対して一度だけ畳み込み処理を行うことで、重複する計算を排除し、学習と推論の両方で高速化を実現した。

元になったR-CNNは、畳み込みニューラルネットワーク(CNN)を用いて画像に写っている物体の種類と位置を特定するモデルである。物体が存在する位置の候補領域(RoI:Regions of Interest)を生成し、そのそれぞれについてCNNによる畳み込み処理を行い、物体の種類の推定を行っていた。この処理は非常に計算コストが重く、時間がかかるのが難点だった。
Fast R-CNNでは、まず画像全体をCNNに入力して一つの特徴マップを作成する。その後、候補領域をこの特徴マップ上に投影し、「RoIプーリング」と呼ばれる手法を用いて各領域から固定長の特徴量を抽出する。候補領域は2000個にも及ぶ場合があり、重たい畳み込み計算を共通化することで処理時間を劇的に短縮することに成功した。
R-CNNでは物体を検出した後、分類にはSVMを、位置の補正には回帰モデルを個別に適用していたが、Fast R-CNNではマルチタスク学習の手法を応用し、この二つの機能もニューラルネットワーク内に統合している。学習を一段階で行うことができ、精度の向上や高速化に寄与している。領域提案だけは独自のアルゴリズムで行う必要があるが、これも後継の「Faster R-CNN」ではネットワーク内に統合されている。