読み方 : オープンポーズ

OpenPose

概要

OpenPoseとは、画像や動画に写っている人物の姿勢を推定するソフトウェア。複数の人物を同時に、リアルタイムに解析することができる。オープンソースライブラリとして提供されており、他のソフトウェアに組み込んで姿勢推定の機能を追加することができる。
OpenPoseのイメージ画像

カーネギーメロン大学の研究チームが開発したもので、ディープラーニング深層学習)を応用した機械学習モデルである。特別なセンサーを用いず一般的なカメラ映像のみで、全身、頭部、手の指に至るまでの関節位置を高精度に特定、追跡することができる。

複数の人物が写っている場合に、画像内のすべての関節を先に検出し、後からそれらを一人ずつ繋ぎ合わせる「ボトムアップ方式」を採用している。トップダウン型手法のように人物検出結果に依存しないため、人物数の増加に対して比較的安定した処理が可能である。

畳み込みニューラルネットワークCNN)を用いて、各関節の存在位置の確率を表すヒートマップと、関節同士の対応関係を示す「PAFs」(Part Affinity Fields)と呼ばれるベクトル場を同時に推定する。これは単に関節の位置を特定するだけでなく、どの関節とどの関節が繋がっているかという「接続の方向と強さ」をベクトル場として予測する仕組みである。

PAFsのベクトル方向に沿って矛盾なく繋がるペアを数学的に選択し、個人の骨格として組み立てていくという手法を採用しており、画像内に多くの人物が入り乱れていたり、身体の一部が重なり合っていたりする複雑な状況下でも、計算量を抑えつつ正確に各個人のポーズを復元することができる。

OpenPoseはスポーツの動作解析やリハビリの支援、防犯カメラによる行動検知など、人間の姿勢や動作の解析が必要な分野で広く活用されている。また、ライブラリとして他のシステムに組み込んで使用できることから、近年では画像生成AIで人物画を生成する際に特定のポーズを指定するための補助ツールとしても広く普及している。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。