読み方 : じょうほうバイアス
情報バイアス【information bias】
情報バイアスとは?
データの収集や測定、記録の過程に偏りがあることで、得られた情報や分析結果が事実から乖離する現象。統計学や疫学、情報科学など幅広い分野で問題となり、分析対象そのものではなく情報の取得過程に原因がある点で、他の誤差とは区別される。

具体的には、アンケートの質問順序や表現が回答を特定の方向へ誘導する場合、被験者が観察されていることを意識して行動を変える場合、過去の出来事を記憶に頼って回答する際に覚え違いや忘却が混入する場合などが該当する。測定機器の誤差によって数値が一定方向にずれることも、情報バイアスの一例である。
こうした偏りは、データ量を増やしても解消されない。偏った方法で大量の情報を収集すると、誤りを含んだまま分析精度だけが高く見える状態になる。このため、統計処理を工夫するよりも前に、情報の集め方そのものに問題がないかを検証することが必要となる。
機械学習の分野では、学習データに情報バイアスが含まれると、モデルが誤った傾向を学習する。例えば、特定の条件でのみ高精度なセンサーを使用していた場合、モデルは測定対象ではなく測定環境の差を学習してしまうことがある。画像認識や自然言語処理においても、データ収集環境の偏りが推論結果に直接影響する。情報バイアスを抑えるために、測定条件の統一、記録方法の標準化、二重盲検法の導入などが用いられる。