読み方 : シャップ
SHAP【SHapley Additive exPlanations】
概要

ゲーム理論の協力ゲームでは、複数のプレイヤーが協力して得た報酬を公平に分配するための指標としてシャープレイ値(Shapley value)が定義されている。機械学習モデルにおける特徴量をプレイヤー、モデル出力を報酬に見立て、特徴量の追加によって生じる予測値の変化量をすべての組み合わせについて平均化することで寄与度を算出する。これにより、「この項目の数値がこうだったから、予測値がこれだけ上がった」といった量的な説明が可能となる。
SHAPの利点として、数理的な裏付けに基づく一貫性と加法性がある。一貫性とは、あるモデルが別のモデルよりも特定の特徴量に強く依存している場合、その特徴量のSHAP値も必ず大きくなるという性質である。加法性とは、各特徴量のSHAP値をすべて足し合わせると、モデルの平均的な予測値と実際の予測値との差分に一致する性質である。これらの特性により、LIMEなどの他の近似的手法と比較して、より信頼性が高く理論的に整合性の取れた説明が可能となる。
実装上の問題として、全組み合わせの計算は指数的に増加するため、近似アルゴリズムやモデル構造を利用した高速化手法が用いられる。決定木モデルに特化した「TreeSHAP」や、ニューラルネットワーク向けの「DeepSHAP」などが提案されており、実用的な計算時間で個々の予測に対する特徴量の寄与度を求めることができる。個別サンプルの説明だけでなく、複数データを解析して、どの特徴量が全体として重要であるかといった分析を行うこともできる。