読み方 : がぞうにんしき

画像認識【image recognition】

概要

画像認識とは、コンピュータによって画像データを解析し、写っている物体の種類や状態、特徴などを自動的に識別する技術。人間の視覚認知を計算機で再現する仕組みで、製品の検品、医療診断、自動運転など幅広い領域で応用されている。
画像認識のイメージ画像

コンピュータにとって画像データは、各画素が持つ色や明るさを数値化した行列として処理される。これらの数値データを特定のアルゴリズムを実装したプログラムニューラルネットワークに入力して計算させ、対象物の形状、色、質感、配置といった特徴をパターンとして見出す。

初期の手法では特徴量を人間が設計して分類器に固定的に実装する方法が主流だったが、近年では、畳み込みニューラルネットワークCNN)を中心とする深層学習が実用化され、大量の学習データを投入することでモデルが自律的に重要な特徴を抽出し、高い精度で識別を行うことができるようになった。

画像認識のタスクは目的に応じていくつかの段階に分類される。画像全体が何であるかを判定する「画像分類」、画像内のどこに何があるかを特定して枠で囲む「物体検出」、さらに画素単位で領域を塗り分けて物体の形を正確に捉える「セグメンテーション」などがある。これらの技術を組み合わせることで、単に物体を判別するだけでなく、周辺の状況の把握や異常の検知といった高度な判断が可能になる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。