パーセンタイル【percentile】百分位数
パーセンタイルとは?

ある値の位置を、全体を百等分したうちのどこにあるかで表す。例えば、「30パーセンタイル」とは、全データを小さい順に並べたときに、下から30%の位置にある値を指す。この値より小さいデータが全体の30%存在することを意味する。中央値(メジアン)はデータを上下に二等分する値であるため、「50パーセンタイル」に相当する。
計算方法は、データを昇順(小さい順)に並べ、求めたい百分率に応じた順位を算出し、その位置の値を採用する。ちょうどその位置に値がない場合は、前後に隣接する値を補間して求める。順位の決め方や補間の仕方にはいくつかの流儀があり、統計ソフトや規格によって結果がわずかに異なることがあるため、利用する手法の定義を確認する必要がある。
パーセンタイルは医療や教育の分野で特によく使われる。子どもの成長曲線では、身長や体重が同年齢の集団の中でどの位置にあるかをパーセンタイルで表現する。学力テストの結果を「上位10%」として示す場合も、90パーセンタイル以上であることを意味する。平均値だけでは分かりにくい個人の相対的な位置を直感的に把握できる。
情報システムの性能評価などでは、応答時間や処理時間の分布を評価する際に、平均値に加えて「95パーセンタイル」(P95)や「99パーセンタイル」(P99)などが参照されることが多い。一部の極端に遅い値の影響を排除し、実際の利用状況に近い性能の傾向を読み取ることが可能となる。
パーセンタイルと似た概念に「四分位数」がある。四分位数はデータを四等分する三つの値で、小さい側から順に「第1四分位数」「第2四分位数」(中央値に等しい)「第3四分位数)という。これはそれぞれ、25、50、75パーセンタイルに対応する。データのばらつきや外れ値の有無を確認する際に、これらを組み合わせた「箱ひげ図」としてよく可視化される。