読み方 : たんじゅんむさくいちゅうしゅつ

単純無作為抽出【simple random sampling】

単純無作為抽出とは?

母集団を構成するすべての要素が等しい確率で選ばれるよう、完全に無作為に標本を取り出す手法。統計調査や世論調査、品質管理、学術研究など、標本調査を伴う様々な分野で用いられる基本的な抽出法である。
単純無作為抽出のイメージ画像

統計的な調査では、調査対象の母集団を全件調査するのが現実的でない場合、一部を取り出して調べる「標本調査」が行われる。母集団から標本を取り出す手法や手順を「標本抽出」と呼び、単純無作為抽出は最も基本的な抽出方法の一つである。

具体的な手順としては、母集団の全要素に重複のない番号を割り振り、乱数表コンピュータが生成する乱数を使って必要な数だけ番号を選ぶ方法が一般的である。抽出の過程に人間の判断や主観が介在しないため、偏りのない標本が得られやすく、標本から得られた統計量(平均や割合など)で母集団全体の特性を高い精度で推定できる。

抽出手順には「復元抽出」と「非復元抽出」の二種類がある。復元抽出は選んだ個体を母集団に戻してから次を選ぶ方式で、非復元抽出は戻さずに続ける方式である。実務上は非復元抽出が多く使われるが、母集団が標本に比べて十分に大きければ、両者の差は統計的にほぼ無視できる。

単純無作為抽出を実施するには、母集団の全要素を網羅した「抽出枠」があらかじめ存在する必要がある。住民基本台帳や従業員名簿のように整備されたリストがあれば実施しやすいが、リストが存在しない場合や母集団の規模が非常に大きい場合には適用が難しくなる。

また、完全に無作為に選ぶ性質上、結果として特定の年齢層や地域が偏って含まれる可能性もある。こうした課題を補うため、単純無作為抽出の代わりに母集団をいくつかの層に分けて各層から抽出する「層化抽出」や、地域・組織などのまとまりを段階的に選ぶ「多段抽出」といった派生手法が使われることもある。

単純無作為抽出は確率論による数理的な解析が進んでおり、標本誤差(標本と母集団のずれ)を数式で見積もることができる。標本サイズが大きいほど誤差は小さくなり、推定精度が上がる。この性質が統計的推測の理論的な根拠となっており、より複雑な抽出手法と比較する際の基準としても位置付けられている。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。