読み方 : いっぱんぶったいにんしき
一般物体認識【generic object recognition】一般物体識別

コンピュータに画像データを与えて解析させ、写っている物体を答えさせるタスクを「物体認識」(object recognition)あるいは「物体識別」(object identification)という。一般物体認識はこのうち、一般名詞で表されるような概念を表す学習データを機械学習システムに与え、人間、犬、車といったように写っている物体の種類を答えさせる。
日常環境に存在する様々な種類の物体に対応できるよう、大規模な学習データが必要となる。髪型や服装が違っていても同じ「人間」に分類したり、犬種が違っていても同じ「犬」に分類できるよう、抽象的な特徴を抽出して学習する仕組みが求められる。また、様々な向きや大きさ、照明条件、一部が隠れて見えない状況でも識別できるよう、多様な学習データが必要になる。
近年の研究では、深層学習、とりわけ畳み込みニューラルネットワーク(CNN)の応用が進展し、大規模な画像データセットを用いた教師あり学習により、物体の形状や質感、文脈情報を階層的に獲得することが可能となった。一方、車の画像から車種を同定するといった、あらかじめデータベースなどに登録された物体を照会して一致するものを答える物体認識タスクは「特定物体認識」という。