二乗平均平方根誤差 【RMSE】 Root Mean Squared Error / RMSD / Root Mean Squared Deviation

概要

二乗平均平方根誤差(RMSE)とは、実際の値と何らかのモデルに基づく予測値があるとき、両者の差を二乗して平均し、平方根(ルート)を取った値。予測モデルの評価に用いられる。

ある事象について実際に測定、観測などで確かめた値と、それぞれの値が得られた条件に基づいて予測関数などから導き出された予測値があるとき、両者の差(予測値の真値からの誤差)を二乗して足し合わせ、標本の数で割って平均した値の平方根である。

予測モデルから得られた値が真の値に近ければ近いほど二乗平均平方根誤差は小さくなり、逆に真値からのズレが大きくなればなるほど二乗平均平方根誤差も大きくなるという関係にある。すべての真値を言い当てることができる完璧な予測モデルの場合には二乗平均平方根誤差の値は0となる。

誤差の二乗を平均した値を「二乗平均誤差」(MSEMean Squared Error)というが、これは元の値を二乗する操作が含まれるため真値や予測値とは次元が異なり同じ尺度で比較することができない。二乗平均平方根誤差はMSEの平方根を取って次元を揃えたものである。

予測モデルの誤差評価法としては他に、誤差の絶対値を平均した「平均絶対誤差」(MAE:Mean Absolute Error)や、誤差の真値に対する割合(パーセンテージ)で表す「平均絶対パーセント誤差」(MAPEMean Absolute Percentage Error)などがある。MSEもRMSEも誤差を二乗してから平均するため、大きな誤差ほど強く影響を受けるという特徴がある。

(2024.5.26更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。