読み方 : だいにしぶんいすう

第2四分位数【second quartile】

第2四分位数とは?

数値データを小さい順に並べたとき、ちょうど中央に位置する値のこと。全体を四等分する三つの境界値である「四分位数」の一つである。「中央値」(メジアン)と同じ値であり、データの下位50%と上位50%の境界となる。
第2四分位数のイメージ画像

数値データの集合を小さい順に並べ、同じ数ずつ4等分したときに、区切りとなる3つの値を「四分位数」という。小さい側から1/4となる位置にある数を「第1四分位数」、ちょうど半分の位置にある数を「第2四分位数」、小さい側から3/4の位置にある数を「第3四分位数」という。

第2四分位数の求め方は、データの個数が奇数か偶数かで異なる。奇数個であれば中央の1点がそのまま第2四分位数となる。例えば「1, 3, 5, 7, 9」の五つでは、3番目の「5」が該当する。偶数個の場合は中央に位置する二つの値の平均をとる。例えば「1, 3, 5, 7, 9, 11」の六つでは、3番目の「5」と4番目の「7」の平均である「6」が第2四分位数となる。

平均値と並んで分布の傾向を把握するために用いられる代表値だが、両者の性質は異なる。平均値はすべての値を加算して個数で割るため、極端に大きい、あるいは小さい値(外れ値)の影響を受けやすい。第2四分位数は順位のみを基準とするため、外れ値があっても中央の位置は変動しない。年収や不動産価格のように分布が大きく偏るデータでは、平均値より実態に近い水準を示すことが多い。

統計分析では、第1・第2・第3四分位数を組み合わせてデータの散らばりを調べることがある。第1四分位数から第3四分位数までの範囲は「四分位範囲」(IQR)と呼ばれ、全体の中央50%が収まる区間を示す。箱ひげ図ではこの三つの四分位数が視覚化され、第2四分位数は箱の内部に引かれる線として表される。この線が箱の中央からどちらへ寄っているかで、データ分布の偏りを直感的に読み取ることができる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。