重回帰分析 【multiple regression】
概要
重回帰分析(multiple regression)とは、3つ以上のデータ系列の間に原因と結果という関係があると考えられるとき、複数の原因のデータから結果のデータを導き出す規則性を明らかにすること。調査や測定などで3つ以上の変数の関係について得られたデータを元に、結果と考えられる1つの変数(目的変数)が、原因と考えられる複数の変数(説明変数)からどのような影響を受けているかを関数(数式)の形で明らかにする。なお、説明変数が1つの場合の回帰分析は「単回帰分析」という。
例えば、ある飲食店のビールの売上(z)とその日の最高気温(x)、降水量(y)についての記録を重回帰分析したところ、定数a、b、cを用いて という1次関数の形で表されたとする。この関係が分かれば、天気予報を元に仕入れ量を調整することができる。
この例では説明変数と目的変数が1次関数で表される直線的な比例関係にあることを仮定しており、これを「線形回帰」あるいは「直線回帰」という。物事の関係性は比例関係で表されるとは限らず、 のような高次の項を含む多項式、指数関数、対数関数、三角関数などが含まれる場合がある。このような正比例以外の関係を含む回帰を総称して「非線形回帰」という。
通常、複数の説明変数はそれぞれ独立に変動するものが選択されるが、説明変数が多いほど精緻な予測ができると期待される場合などには、互いに強い相関関係を持つ説明変数の組み合わせが採用されてしまう場合もある。そのような状態を「多重共線性」と呼び、データの増減に対して係数が不規則に大きく変化する。
(2024.5.26更新)