データの整理
【定義】
変量:人の身長,体重や運動の記録などのように,ある特性を表す数量
データ:ある変量の測定値や観測値の集まり
※データ全体の傾向を掴むために,データを整理する方法を工夫すると,全体の様子が見えてくる。
度数分布表:データのとる値をいくつかの区間に区切って階級を定め,各階級に度数を対応させた表
階級値:度数分布表における各階級の中央の値
ヒストグラム:度数分布表を柱状のグラフで表したもの
※データの分布の状態は,度数分布表やヒストグラムなどによって知ることができる。
データの代表値
【定義】
代表値:データ全体の特徴を表すのに適当な1つの数値
平均値:変量 $x$ のデータの値が $x_1$,$x_2$,……,$x_n$ であるとき,このデータの平均値 $\overline{x}$ は $\overline{x} = \frac{1}{n} (x_1+x_2+……+x_n)$
最頻値(モード):データにおいて,最も個数の多い値
※データが度数分布表に整理されているときは,度数が最も大きい階級の階級値。
中央値(メジアン):データを値の大きさの順に並べたとき,その中央の位置にくる値
※データの大きさが偶数のときは,中央の2つの値の平均値。