読み方 : ぶったいにんしき

物体認識【object recognition】物体識別/object identification

概要

物体認識とは、画像や映像に含まれる物体が何であるかを判別・特定する技術。画像全体や特定の領域を対象に何が写っているかを答えるタスクであり、コンピュータビジョン(CV)における基本的なタスクの一つ。
物体認識のイメージ画像

入力された画像や切り出された領域に対して、あらかじめ定義された分類クラス)の中から最も当てはまると思われるクラスを推定する。ニューラルネットワークなどを用いた高度な手法では、ソフトマックス関数を用いて「犬80%、猫15%、狸5%」といったように回答の候補と確信度を合わせたベクトルを出力することもある。

初期の手法では、色や形状といった特徴量を人間が定式化して識別器を構成する方式が主流だったが、近年では畳み込みニューラルネットワークCNN)などを応用した深層学習ディープラーニング)が主流である。これは、正解ラベルの付いた画像データを大量に与えて学習させることで、内在する特徴を自律的に見出して分類を行えるようになる。

物体をどのように認識するかによって大きく二つのタスク分類される。一つは「特定物体認識」で、車の画像から車種を答えるといったように、あらかじめ与えられたデータベースに収録された特定の対象に一致する物体を答えさせる。もう一つは「一般物体認識」で、一般名詞で表されるような概念を学習させ、人間、犬、車といったように写っている物体の種類を答えさせる。

物体認識は「画像認識」(image recognition)として総称される手法の一つである。画像認識タスクとしては他に、画像内に写っている物体の種類と位置を答える「物体検出」(object detection)や、画素単位でどの物体へ帰属するか判定する「セグメンテーション」(segmentation)、人間のポーズを特定する「姿勢推定」(pose estimation)などがある。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。