読み方 : シャップ

SHAP【SHapley Additive exPlanations】

概要

SHAPとは、機械学習モデルの予測結果を説明する手法の一つで、モデルの出力を特徴量ごとの寄与度に分解し、各入力要素が結果に与えた影響を定量的に算出するもの。ゲーム理論の「シャープレイ値」を応用した手法で、一貫性と公平性のある説明を可能にする。
SHAPのイメージ画像

ゲーム理論の協力ゲームでは、複数のプレイヤーが協力して得た報酬を公平に分配するための指標としてシャープレイ値(Shapley value)が定義されている。機械学習モデルにおける特徴量をプレイヤー、モデル出力を報酬に見立て、特徴量の追加によって生じる予測値の変化量をすべての組み合わせについて平均化することで寄与度を算出する。これにより、「この項目の数値がこうだったから、予測値がこれだけ上がった」といった量的な説明が可能となる。

SHAPの利点として、数理的な裏付けに基づく一貫性と加法性がある。一貫性とは、あるモデルが別のモデルよりも特定の特徴量に強く依存している場合、その特徴量のSHAP値も必ず大きくなるという性質である。加法性とは、各特徴量のSHAP値をすべて足し合わせると、モデルの平均的な予測値と実際の予測値との差分に一致する性質である。これらの特性により、LIMEなどの他の近似的手法と比較して、より信頼性が高く理論的に整合性の取れた説明が可能となる。

実装上の問題として、全組み合わせの計算は指数的に増加するため、近似アルゴリズムやモデル構造を利用した高速化手法が用いられる。決定木モデルに特化した「TreeSHAP」や、ニューラルネットワーク向けの「DeepSHAP」などが提案されており、実用的な計算時間で個々の予測に対する特徴量の寄与度を求めることができる。個別サンプルの説明だけでなく、複数データを解析して、どの特徴量が全体として重要であるかといった分析を行うこともできる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。