Mathrao

【定理・公式・証明】高校数学定理・公式 – 数学Ⅰ – 分散・標準偏差・共分散・相関係数

スポンサーリンク

分散①と標準偏差

$n$ 個の値からなるデータ $x_{1}$ , $x_{2}$ ,・・・,$x_{n}$ の平均値を $\overline{x}$ とする。このデータの分散を $s_{x}^2$ ,標準偏差を $s_{x}$ とすると,

$\displaystyle s_{x}^2 =\frac{(x_{1} – \overline{x} )^2 +・・・+(x_{n} – \overline{x})^2}{n}$ , $s_{x}= \sqrt{s_{x}^2}$

 

スポンサーリンク

共分散①と相関係数

2つの変数 $x$ , $y$ からなるデータとして, $n$ 個の値の組( $x_{1}$ ,$y_{1}$ ),( $x_{2}$ , $y_{2}$ ),・・・,( $x_{n}$ , $y_{n}$ )がある。$x$ の偏差と $y$ の偏差の積の平均を共分散といい, $s_{xy}$ で表すと,

$\displaystyle s_{xy}= \frac{1}{n} \{(x_{1} – \overline{x} )(y_{1} – \overline{y} )+ ・・・ +(x_{n} – \overline{x} )(y_{n} – \overline{y} ) \}$

また,共分散 $s_{xy}$ を $x$ の標準偏差 $s_{x}$ と $y$ の標準偏差 $s_{y}$ の積 $s_{x} s_{y}$ で割った値を $x$ , $y$ の相関係数といい, $r$で表すと,

$\displaystyle r=\frac{s_{xy}}{s_{x} \cdot s_{y}}$

 

スポンサーリンク

【発展】分散②

$n$ 個の値からなるデータ $x_{1} , x_{2} , ・・・ , x_{n}$ の平均値を $\overline{x}$ 分散を $s_{x}^2$ とし,$n$ 個の値の2乗の平均を $\overline{x^2}$ とするとき,

$s_{x}^2 = \overline{x^2} -( \overline{x} )^2$ 

証明

分散①の式を変形すると,

$\displaystyle s_{x}^2 = \frac{1}{n} \{ (x_{1} – \overline{x} )^2 +( x_{2} – \overline{x} )^2 +・・・+ (x_{n} – \overline{x} )^2 \}$

$\displaystyle = \frac{1}{n} \{ (x_{1}^2 +x_{2}^2 +・・・+ x_{n}^2 )-2 \overline{x} (x_{1} + x_{2} +・・・+ x_{n}) +n( \overline{x} )^2 \}$ 

$\displaystyle = \frac{1}{n} ( x_{1}^2 + x_{2}^2 +・・・+ x_{n}^2 ) -2 \overline{x} \frac{1}{n} (x_{1} + x_{2} +・・・+ x_{n} ) +( \overline{x} )^2$

$= \overline{x^2} -2 \overline{x} \cdot \overline{x} + ( \overline{x} )^2$

$= \overline{x^2} -2( \overline{x} )^2 +( \overline{x} )^2$

$= \overline{x^2} -( \overline{x} )^2$

このように,

$( x の分散)=(x^2 の平均値)-(x の平均値)^2$

となり, $x$ の分散は $x^2$ の平均値と $x$ の平均値の2乗の差から求めることもできる。

 

スポンサーリンク

【発展】共分散②

2つの変量 $x$ , $y$ からなるデータとして, $n$ 個の値の組 $(x_{1} , y_{1} ) , (x_{2} , y_{2} ) ,・・・, (x_{n} , y_{n} )$ がある。 $x$ , $y$ の平均値を $\overline{x}$ , $\overline{y}$ とすると,共分散 $s_{xy}$ は,

$\displaystyle s_{xy} = \frac{1}{n} (x_{1} y_{1} + x_{2} y_{2} +・・・+ x_{n} y_{n}) – \overline{x} \cdot \overline{y}$

と表せる。

証明

$x$ , $y$ の平均値を $\overline{x}$ , $\overline{y}$ とすると,

$\displaystyle \overline{x} = \frac{x_{1} + x_{2}+・・・+ x_{n}}{n}$ , $\displaystyle \overline{y} = \frac{y_{1} + y_{2} +・・・+ y_{n}}{n}$ 

共分散の定義より,

$\displaystyle s_{xy} = \frac{(x_{1} – \overline{x} )(y_{1} – \overline{y}) + (x_{2} – \overline{x})(y_{2} – \overline{y})+・・・+ (x_{n} – \overline{x})(y_{n} – \overline{y}}{n})$

ここで, $i=1,2,・・・,n$ に対して,

$(x_{i} – \overline{x})(y_{i} – \overline{y}) =x_{i} y_{i} – x_{i} \overline{y} – \overline{x} y_{i} + \overline{x} \overline{y}$

と変形できるので,

$\displaystyle s_{xy}= \frac{(x_{1} y_{1} -x_{1} \overline{y} – \overline{x} y_{1} + \overline{x} \cdot \overline{y} )+ (x_{2} y_{2} -x_{2} \overline{y} – \overline{x} y_{2} + \overline{x} \cdot \overline{y})+・・・+(x_{n} y_{n} -x_{n} \overline{y} – \overline{x} y_{n} + \overline{x} \cdot \overline{y})}{n}$

$\displaystyle = \frac{(x_{1} y_{1} + x_{2} y_{2} +・・・+x_{n} y_{n}) – (x_{1} + x_{2} +・・・+ x_{n}) \overline{y} – (y_{1} + y_{2} +・・・+ x_{n}) – \overline{x} (y_{1} + y_{2} +・・・+ y_{n}) +n \overline{x} \cdot \overline{y}}{n}$

$\displaystyle = \frac{x_{1} y_{1} + x_{2} y_{2} +・・・+ x_{n} y_{n}}{n} – \frac{x_{1} + x_{2} +・・・+ x_{n}}{n} \overline{y} – \overline{x} \frac{y_{1} + y_{2} +・・・+ y_{n}}{n} + \overline{x} \cdot \overline{y}$

$\displaystyle = \frac{x_{1} y_{1} + x_{2} y_{2} +・・・+ x_{n} y_{n}}{n} – \overline{x} \cdot \overline{y} – \overline{x} \cdot \overline{y} + \overline{x} \cdot \overline{y}$

$\displaystyle =\frac{1}{n} (x_{1} y_{1} + x_{2} y_{2} +・・・+ x_{n} y_{n}) – \overline{x} \cdot \overline{y}$