クロスセクションデータ【cross-sectional data】

概要

クロスセクションデータとは、ある特定の時点において、複数の対象から収集された観測値をまとめたデータのこと。時間的な推移ではなく、同時点での違いに着目するためのデータである。
クロスセクションデータのイメージ画像

単一時点での情報を横断的に集めたもので、ある年の様々な企業の売上高、ある日の店舗ごとの来店客数、ある時点における世帯の所得水準などが該当する。対象間の差異が主な分析対象となり、地域差、企業規模差、年齢層別の傾向など、属性による違いを明らかにすることが目的となる場合が多い。

これに対し、同一対象を時間の経過に沿って追跡したデータは「時系列データ」と呼ばれる。また、複数の対象を時間的に追跡する形式は「パネルデータ」と呼ばれる。クロスセクションデータは時間変化を直接扱わないため、分析の焦点は対象間の構造的な関係に置かれる。例えば、所得と消費支出の関係、学歴と賃金の関係といった相関分析回帰分析が応用例として挙げられる。

クロスセクションデータの分析では、観測単位ごとの独立性が前提とされることが多い。しかし、実際には、地域、家族、企業グループなどの共通要因によって観測値が相関する場合もある。そのため、分散の不均一性やクラスタリングを考慮した推定手法が用いられることもある。単一時点の情報であるため、因果関係の方向や時間的な先後関係を直接確認する用途には適していない。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。