Mathrao

【定義・定理・公式】高校数学基本事項 – 数学Ⅰ – データの散らばり

スポンサーリンク

データの散らばりと四分位数

【定義】

範囲:データの最大値から最小値を引いた差

四分位数:データを値の大きさの順に並べたとき,4等分する位置にくる値で,小さい方から順に第1四分位数 $Q_1$第2四分位数 $Q_2$第3四分位数 $Q_3$ という

※ $Q_2$ は中央値である。

※四分位数の求め方

  1. データを値の大きさ順(小→大)に並べ,中央値を求める。この値が第2四分位数 $Q_2$ となる。
  2. 中央値を境界としてデータの個数を2等分し,値が中央値以下の下組と,値が中央値以上の上組に分ける。ただし,データの個数が奇数のとき,中央値はどちらの組にも含めない。
  3. 下組の中央値が第1四分位数 $Q_1$,上組の中央値が第3四分位数 $Q_3$ となる。

四分位範囲:データの第3四分位数 $Q_3$ と第1四分位数 $Q_1$ の差 $Q_3-Q_1$

※データを値の大きさの順に並べたときの中央に並ぶ約50%のデータの散らばり度合いを表しているため,データの中に極端に飛び離れた値がある場合でも,その影響を受けにくいといえる。

四分位偏差:四分位範囲の半分 $\displaystyle \frac{Q_3-Q_1}{2}$

※範囲,四分位範囲,四分位偏差はデータの散らばりの度合いを表す1つの量で,大きいほどデータの散らばり度合いが大きいと考えられる。

箱ひげ図:データの最小値,第1四分位数,中央値,第3四分位数,最大値を箱と線(ひげ)で表現する図

※平均値を記入することもある

※箱ひげ図ではヒストグラムほどにはデータの分布が詳しく表現されないが,大まかな様子は分かる。また,箱ひげ図はヒストグラムほどに複雑な形ではないので,複数のデータについての箱ひげ図を並べてかくことも比較的容易である。そのため,箱ひげ図は複数のデータの分布を比較するのに有効である。

 

スポンサーリンク

分散と標準偏差

【定義】

偏差:データの各値 $x$ と平均値 $\overline{x}$ との差 $x- \overline{x}$

分散( $s^2$ ):偏差の2乗の平均値

$s^2= \displaystyle \frac{1}{n} \{ (x_1- \overline{x} )^2+(x_2- \overline{x} )^2+……+(x_n- \overline{x} )^2 \}$

$s^2= \overline{x^2} -( \overline{x} )^2$

標準偏差( $s$ ):分散の正の平方根

$s= \sqrt{分散} = \sqrt{ \displaystyle \frac{1}{n} \{ (x_1- \overline{x} )^2+(x_2- \overline{x} )^2+……+(x_n- \overline{x} )^2 \} }$

※一般に,分散・標準偏差が大きいほどデータの散らばりの度合いが大きく,分散・標準偏差が小さいほど,データの値が平均値の周りに集中する傾向にある。