クロスセクションデータ【cross-sectional data】

単一時点での情報を横断的に集めたもので、ある年の様々な企業の売上高、ある日の店舗ごとの来店客数、ある時点における世帯の所得水準などが該当する。対象間の差異が主な分析対象となり、地域差、企業規模差、年齢層別の傾向など、属性による違いを明らかにすることが目的となる場合が多い。
これに対し、同一対象を時間の経過に沿って追跡したデータは「時系列データ」と呼ばれる。また、複数の対象を時間的に追跡する形式は「パネルデータ」と呼ばれる。クロスセクションデータは時間変化を直接扱わないため、分析の焦点は対象間の構造的な関係に置かれる。例えば、所得と消費支出の関係、学歴と賃金の関係といった相関分析や回帰分析が応用例として挙げられる。
クロスセクションデータの分析では、観測単位ごとの独立性が前提とされることが多い。しかし、実際には、地域、家族、企業グループなどの共通要因によって観測値が相関する場合もある。そのため、分散の不均一性やクラスタリングを考慮した推定手法が用いられることもある。単一時点の情報であるため、因果関係の方向や時間的な先後関係を直接確認する用途には適していない。