読み方 : ひょうほんちゅうしゅつ

標本抽出【sampling】サンプリング

標本抽出とは?

調査や分析の対象となる集団全体(母集団)から一部の個体やデータを取り出す操作。母集団全体を調べる全数調査が時間や費用、物理的制約から困難な場合に、抽出した標本をもとに全体の傾向を推定するために行われる。
標本抽出のイメージ画像

調査対象の集団全体を「母集団」(population)、そこから取り出した一部を「標本」(sample)と呼ぶ。標本が母集団の性質を適切に反映していれば、全体の傾向をある程度正確に推測できる。逆に標本の代表性が損なわれていると、分析結果に偏り(バイアス)が生じ、母集団の実態とは異なる結論が導かれる。

抽出方法は大きく、確率に基づく「確率標本抽出」と、調査者の判断による「非確率標本抽出」に分けられる。前者の代表が「無作為抽出」で、母集団の各要素が等しい確率で選ばれるため偏りを抑えやすい。これを基本として、母集団をグループに分けて各層から抽出する「層別抽出」、一定間隔で選ぶ「系統抽出」、集団単位で抽出する「クラスター抽出」などがある。非確率標本抽出では、調査しやすい対象を優先する「有意抽出」が代表的で、簡便だが偏りが生じやすい。

標本抽出を活用することで、全数を調査する場合と比べてコストや時間を大幅に削減できる。製品の破壊検査のように全数調査を実施すると対象そのものが失われる場合や、母集団が膨大で全容の把握が物理的に困難な場合にも有効である。一方、標本はあくまで全体の一部であるため、得られた結果には「標本誤差」が伴う。誤差を許容範囲内に収めるには、適切な抽出方法の選択と十分な標本数の確保が求められる。標本数が少なすぎると偶然の影響を受けやすく、推定精度が低下する。

統計学では、標本から求めた平均値や割合などの「標本統計量」をもとに、母集団の特性(母数)を推定する。標本抽出は統計的推定仮説検定の前提となる工程であり、世論調査や品質管理、医学臨床試験、機械学習データ準備など幅広い分野で用いられる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。