読み方 : オープンポーズ
OpenPose
概要

カーネギーメロン大学の研究チームが開発したもので、ディープラーニング(深層学習)を応用した機械学習モデルである。特別なセンサーを用いず一般的なカメラ映像のみで、全身、頭部、手の指に至るまでの関節位置を高精度に特定、追跡することができる。
複数の人物が写っている場合に、画像内のすべての関節を先に検出し、後からそれらを一人ずつ繋ぎ合わせる「ボトムアップ方式」を採用している。トップダウン型手法のように人物検出結果に依存しないため、人物数の増加に対して比較的安定した処理が可能である。
畳み込みニューラルネットワーク(CNN)を用いて、各関節の存在位置の確率を表すヒートマップと、関節同士の対応関係を示す「PAFs」(Part Affinity Fields)と呼ばれるベクトル場を同時に推定する。これは単に関節の位置を特定するだけでなく、どの関節とどの関節が繋がっているかという「接続の方向と強さ」をベクトル場として予測する仕組みである。
PAFsのベクトル方向に沿って矛盾なく繋がるペアを数学的に選択し、個人の骨格として組み立てていくという手法を採用しており、画像内に多くの人物が入り乱れていたり、身体の一部が重なり合っていたりする複雑な状況下でも、計算量を抑えつつ正確に各個人のポーズを復元することができる。
OpenPoseはスポーツの動作解析やリハビリの支援、防犯カメラによる行動検知など、人間の姿勢や動作の解析が必要な分野で広く活用されている。また、ライブラリとして他のシステムに組み込んで使用できることから、近年では画像生成AIで人物画を生成する際に特定のポーズを指定するための補助ツールとしても広く普及している。