読み方 : ブートストラップほう

ブートストラップ法 【bootstrapping】 ブートストラップサンプリング

概要

ブートストラップ法(bootstrapping)とは、母集団となるデータセットから複数の部分集合(サブセット)を作成する手法の一つで、母集団から重複を許して無作為に標本を抽出する方式。母集団の統計量の推定や機械学習に応用される。

母集団からランダムに標本を抽出し、母集団と同じ数あるいは少ない数のサブセットを作成する。抽出時には同じデータが複数回繰り返し抽出されることも許容する。抽出した標本は母集団に戻して(復元抽出)、同じ手順で次のサブセットの作成を行う。同じデータが複数のサブセットに繰り返し登場する可能性がある。

統計解析では、ブートストラップ法で抽出したサブセットに対して平均や分散、標準偏差などの統計量を算出する。何度も繰り返し抽出と算出を繰り返すことで、母集団の特徴を反映した統計量の分布を得ることができる。

統計量の分布を分析することで、母集団から一回限り算出した値よりも信頼性の高い結果を得ることができる。これは母集団の標本数が少ない場合に特に有効である。また、母集団に対して正規分布など特定の分布を仮定しなくても信頼区間の推定などを行うことができる。

機械学習では、同じモデルを複数の方法やデータセットで繰り返し作成する「アンサンブル学習」に応用される。教師データからブートストラップ法で抽出したサブセットで訓練したモデルを複数作成し、それぞれの出力を平均や多数決で統合して最終的な結果を得る。この手法を「バギング」(bootstrap aggregating)と呼び、決定木と組み合わせた「ランダムフォレスト」が特によく知られている。

(2025.9.24更新)