読み方 : がぞうにんしき
画像認識【image recognition】
概要

コンピュータにとって画像データは、各画素が持つ色や明るさを数値化した行列として処理される。これらの数値データを特定のアルゴリズムを実装したプログラムやニューラルネットワークに入力して計算させ、対象物の形状、色、質感、配置といった特徴をパターンとして見出す。
初期の手法では特徴量を人間が設計して分類器に固定的に実装する方法が主流だったが、近年では、畳み込みニューラルネットワーク(CNN)を中心とする深層学習が実用化され、大量の学習データを投入することでモデルが自律的に重要な特徴を抽出し、高い精度で識別を行うことができるようになった。
画像認識のタスクは目的に応じていくつかの段階に分類される。画像全体が何であるかを判定する「画像分類」、画像内のどこに何があるかを特定して枠で囲む「物体検出」、さらに画素単位で領域を塗り分けて物体の形を正確に捉える「セグメンテーション」などがある。これらの技術を組み合わせることで、単に物体を判別するだけでなく、周辺の状況の把握や異常の検知といった高度な判断が可能になる。