パターン認識 【pattern recognition】
概要
パターン認識(pattern recognition)とは、情報処理の類型の一つで、文字や画像、動画、音声などの大量の情報の中から、特定のパターンに一致するものを他と区別して取り出すこと。人間を含む動物は感覚器官から外界の情報を取り込み、脳などの神経回路の働きによってパターン認識を行い、次の行動を判断する手掛かりの一つにしている。コンピュータでも、大量のデータの中からプログラムや専用の論理回路によって特定のパターンを抽出するという処理がよく行われる。
例えば、文書を撮影した画像データはそのままでは文字データとして扱うことはできないが、一定の処理によって画像中に含まれる文字に一致するパターンを抽出し、これを繋ぎ合わせて書かれている文字をデータとして取り出すことができる。このシステムを「OCR」(光学文字認識)という。
文字列の中から特定の文字パターンを抽出する処理はソフトウェアによって頻繁に行われ、古くから様々なアルゴリズムが研究されてきている。正規表現のような表記法や処理システムの整備も進んでおり、全文検索などの応用例も幅広く存在する。
画像や音声、動画などを対象としたパターン認識はデータ量の多さや複雑さなどから研究や応用がなかなか進まなかったが、近年では人工知能の一分野である機械学習などの手法が飛躍的に進展し、音声認識や画像認識、顔認識などで実用的なシステムが提供されるようになってきている。
(2024.8.30更新)