読み方 : こんどうぎょうれつ
混同行列【confusion matrix】

表の各行は実際の分類(クラス)を、各列はモデルが予測した分類を表しており、各マスに当てはまるデータの件数を書き入れる。予測と実際の分類が一致しているマスは正解の件数であり、一致しないマスは不正解の件数を表している。
最も単純な例は、データを「○○である」「○○ではない」の二通りに分類する問題で、2×2の表にすることができる。例えば、写真に写っている動物を「猫」「猫以外」に分類する問題では、「予測も実際も猫」「予測は猫だが実際は猫以外」「予測は猫以外だが実際は猫」「予測も実際も猫以外」の4マスができる。
一般に、「Xと予測して実際Xだった」例を「真陽性」(TP:True Positive)、「Xではないと予測して実際にXではなかった」例を「真陰性」(TN:True Negative)、「Xと予測したがXではなかった」例を「偽陽性」(FP:False Positive)、「Xではないと予測したがXだった」例を「偽陰性」(FN:False Negative)という。
混同行列の各マスの値を用いて、様々な予測性能の指標を算出できる。「正解率」(accuracy)は、全例の中で正解だった例の割合で、真陽性と真陰性の和を全例で割る。「適合率」(precision)は、Xと予測した例の中で実際にXだった例の割合で、真陽性を、真陽性と偽陽性の和で割る。「再現率」(recall)は、実際にXだった例の中で、正しくXと予測できた例の割合で、真陽性を、真陽性と偽陰性の和で割る。
(2025.11.15更新)