二乗平均平方根誤差 【RMSE】 Root Mean Squared Error / RMSD / Root Mean Squared Deviation
ある事象について実際に測定、観測などで確かめた値と、それぞれの値が得られた条件に基づいて予測関数などから導き出された予測値があるとき、両者の差(予測値の真値からの誤差)を二乗して足し合わせ、標本の数で割って平均した値の平方根である。
予測モデルから得られた値が真の値に近ければ近いほど二乗平均平方根誤差は小さくなり、逆に真値からのズレが大きくなればなるほど二乗平均平方根誤差も大きくなるという関係にある。すべての真値を言い当てることができる完璧な予測モデルの場合には二乗平均平方根誤差の値は0となる。
誤差の二乗を平均した値を「二乗平均誤差」(MSE:Mean Squared Error)というが、これは元の値を二乗する操作が含まれるため真値や予測値とは次元が異なり同じ尺度で比較することができない。二乗平均平方根誤差はMSEの平方根を取って次元を揃えたものである。
予測モデルの誤差評価法としては他に、誤差の絶対値を平均した「平均絶対誤差」(MAE:Mean Absolute Error)や、誤差の真値に対する割合(パーセンテージ)で表す「平均絶対パーセント誤差」(MAPE:Mean Absolute Percentage Error)などがある。MSEもRMSEも誤差を二乗してから平均するため、大きな誤差ほど強く影響を受けるという特徴がある。
(2024.5.26更新)