読み方 : しせいすいてい

姿勢推定【pose estimation】

概要

姿勢推定とは、画像や動画、センサデータから人間や動物、物体の関節位置や向きを推定し、全体の姿勢を数値的に表現する技術。姿勢や動作をデジタルデータとして取り込み、様々な形で活用することができる。
姿勢推定のイメージ画像

主に人間の骨格構造を対象として、頭部や胴体、手足などのパーツやそれぞれが結合する関節を検出し、それらの相対位置関係から姿勢を表現する。画像を用いる場合、畳み込みニューラルネットワークCNN)によって関節位置を直接回帰する手法や、各関節の存在確率を示すヒートマップを推定する手法が用いられる。

一枚の画像の上で関節などの位置を特定することを「2次元姿勢推定」、奥行きの情報を加えて実際の空間内での立体的な姿勢を特定することを「3次元姿勢推定」という。一枚の画像のみから正確な3次元推定を行うことは難しく、同時に撮影した複数のカメラの画像や深度センサの情報を組み合わせる必要がある。

画像に複数の人物が写っている場合、画像内の個々の人物をまず検出し、その後に各人の関節位置を特定する手法を「トップダウン方式」、画像内のすべての関節を先に検出し、それらが誰の部位であるかを関連付けて統合する手法を「ボトムアップ方式」という。前者は精度が高い一方で人数が増えると処理時間が増大し、後者は多人数が入り乱れる状況でも計算量が安定するという特徴がある。

姿勢推定は動作認識や歩容認証、スポーツの動作解析、医療やリハビリテーション、機械やコンピュータの操作(ヒューマンインターフェース)、モーションキャプチャによる映像制作など幅広い分野で利用されている。近年は深層学習の発展により複雑な姿勢や遮蔽を含む状況への対応が進んでいる。近年では深層学習の発展により、背景が複雑な場所や、身体の一部が他の物体に隠れている状況下でも、高い精度で姿勢を特定できる手法が開発されている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。