相関分析 【correlation analysis】
概要
相関分析(correlation analysis)とは、2つのデータ系列の間にどの程度強い相関が見られるかを調べること。通常は線形相関(比例関係)の強さを調べることを指し、相関係数を求めてその絶対値の大きさから判断する。2つの事象に関わりがあり、一方が変化するともう一方も変化するような関係を「相関」という。一方が増えるともう一方が増える関係を「正の相関」、一方が増えるともう一方は減る関係を「負の相関」という。
2つの変数がどの程度比例関係(線形相関)に従って連動しているかを表す係数を「相関係数」(correlation efficient)という。同数のデータ系列 と から算出した共分散 とそれぞれの標準偏差 および を用いて として求められる。
相関係数は-1から1の間の実数を取り、0ならば両者に線形相関はなく、1なら完全な正の相関、-1なら完全な負の相関がある。絶対的な評価基準はないが、概ね-0.3~0.3程度であれば両者の間に線形の相関はほぼないと判断され、-0.3~-0.6程度であれば弱い負の相関が、0.3~0.6程度であれば弱い正の相関が、-0.6~-1.0程度ならば強い負の相関が、0.6~1.0程度ならば強い正の相関があると判断される。
なお、相関係数は線形(比例)の関係に従っているかどうかを評価する値であるため、比例関係以外の何らかの非線形な関係性に基づいてきれいに連動していても、相関係数は0近辺(線形相関なし)と判定されることになる。両者の関係性は相関係数だけでなく散布図などをよく見て判断すべきとされる。
(2024.5.24更新)