読み方:どすうぶんぷ

度数分布 【frequency distribution】

概要

度数分布(frequency distribution)とは、多数のデータを整理する手法の一つで、値を一定の幅ごとに区切り、それぞれの範囲に属するデータの数を集計したもの。データの散らばり具合など全体の傾向を掴むことができ、元の標本群より解析もしやすい。
度数分布のイメージ画像

多数の数値データを分析する際に用いる集計法の一つで、データが取りうる値を均等な幅の区間(これを階級という)に分割し、各階級に属するデータを数える。階級と値の数(度数)を表の形でまとめたものを「度数分布表」、グラフに表したものを「度数分布図」(ヒストグラム)という。

例えば、テストの点数を表にまとめる場合、「0~19点」「20~39点」「40~59点」「60~79点」「80~100点」といった階級に区切り、それぞれに属する人数を数えて「3人」「5人」「7人」「13人」「5人」などのように集計していく。

各階級の中央の値「10点」「30点」「50点」「70点」「90点」を、その階級を代表する「階級値」という。階級の幅は任意に決めてよいが、小さすぎると度数の差がつきにくく、大きすぎると度数の変化が大きすぎて分布の様子が分かりにくくなる。

度数は、階級に属する値の数の絶対値以外にも、その階級の度数が全体に占める割合である「相対度数」、最も低い階級からその階級までの合計である「累積度数」、その階級までの相対度数の累積である「累積相対度数」などを用いることがある。

(2025.9.1更新)

データサイエンスの用語一覧