ROC曲線 【Receiver Operating Characteristic curve】
概要
ROC曲線(Receiver Operating Characteristic curve)とは、検査で得られた何らかの測定値に基づいて異常は正常かの判定を下す際、様々な閾値における真陽性率と偽陽性率の関係をグラフに表したもの。検査の有効性(判別能)を知ることができる。医療における検査などで、何らかの測定値が基準となる閾値(カットオフポイント)を超えたら異常あり(陽性)、下回れば正常(陰性)と判定することがある。その際、正常と判断したのに実際は異常だった「偽陽性」(false positive)、異常と判断したのに実際は正常だった「偽陰性」(false negative)という2種類の判定ミスが発生する。
ここでは値が高いほど異常の可能性が高い場合を考え、「実際に異常だった例を正しく異常と判定できた割合」である「TPR」(True Positive Rate:真陽性率)と、「実際は正常だった例を誤って異常と判定した割合」である「FPR」(False Positive Rate:偽陽性率)に着目する。
異常と判断する閾値を極端に高い値(例えば∞)に設定すると、全例を正常と判定するため、TPRもFPRも0となる。一方、閾値を極端に低い値(例えば-∞)にすると、今度は全例を異常と判定するため、TPRもFPRも1.0となる。閾値を低い方から次第に上げていくと、はじめにTPRが上昇し、遅れてFPRが上昇する。
この変化の様子を、縦軸をTPR、横軸をFPRとする折れ線グラフに描くと、原点と(1.0, 1.0)を結ぶ左上に膨らんだ曲線となる。これをROC曲線という。正常と異常を誤りなく見分けられる理想的な検査では、原点から垂直に直線が立ち上がり、(0, 1.0)から(1.0, 1.0)に向かって今度は水平に直線が引かれる。逆に、まったく正しく見分けられない検査では、原点からまっすぐ(1.0, 1.0)に向かう斜めの45°の直線となる。
ROC曲線から検査の良し悪しを定量的に評価するため、曲線が囲う下側の面積である「AUC」(Area Under Curve)を用いることがある。最良の検査では囲まれた部分が正方形となるためAUCは「1.0」、最悪の検査では直角二等辺三角形となるためAUCは「0.5」となる。この範囲の中で1.0に近いほど優れた検査であると言える。