読み方 : きょうぶんさん

共分散【covariance】

概要

共分散とは、二つのデータ系列(変数)がどの程度同じように変動しているかを示す指標。変数間の変化の共通性を数量的に表し、値が正であれば同じ方向に、負であれば逆方向に同時に変化しており、0に近ければ変化の仕方に共通点が乏しいことがわかる。
共分散のイメージ画像

データ点ごとに、それぞれの変数の平均値との差を乗算し、系列全体に渡って平均することで算出される。数式で表すと Sxy=1n-1i=0n(xi-x)(yi-y) となる。i番目のxの平均値との差、yの平均値との差の積を求め、これを系列全体で積算して平均を求める。

あるポイントで二つの変数がともに平均より大きい値を取る場合や、平均より小さい値を取る場合には偏差の積が正となる。逆に、片方が平均より大きく、もう片方が平均より小さいポイントでは積は負となる。積の多くが正の値である系列は共分散も正となり、逆に大半が負である系列は共分散も負となる。両者に連動性が見られない系列ではポイントごとに正負がばらつくため、共分散は0に近い小さい値となる。

注意点として、共分散の絶対値の大きさは変数の単位や尺度に依存するため、異なるデータ系列の共分散の値を比較して、こちらの方がより連動性が強い、といった主張に用いることはできない。変数間の関係の強さを標準化された値として測りたい場合は相関係数など別の指標を用いる。

(2025.12.11更新)
この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。