分散①と標準偏差
$\displaystyle s_{x}^2 =\frac{(x_{1} – \overline{x} )^2 +・・・+(x_{n} – \overline{x})^2}{n}$ , $s_{x}= \sqrt{s_{x}^2}$
共分散①と相関係数
$\displaystyle s_{xy}= \frac{1}{n} \{(x_{1} – \overline{x} )(y_{1} – \overline{y} )+ ・・・ +(x_{n} – \overline{x} )(y_{n} – \overline{y} ) \}$
また,共分散 $s_{xy}$ を $x$ の標準偏差 $s_{x}$ と $y$ の標準偏差 $s_{y}$ の積 $s_{x} s_{y}$ で割った値を $x$ , $y$ の相関係数といい, $r$で表すと,
$\displaystyle r=\frac{s_{xy}}{s_{x} \cdot s_{y}}$
【発展】分散②
$s_{x}^2 = \overline{x^2} -( \overline{x} )^2$
分散①の式を変形すると,
$\displaystyle s_{x}^2 = \frac{1}{n} \{ (x_{1} – \overline{x} )^2 +( x_{2} – \overline{x} )^2 +・・・+ (x_{n} – \overline{x} )^2 \}$
$\displaystyle = \frac{1}{n} \{ (x_{1}^2 +x_{2}^2 +・・・+ x_{n}^2 )-2 \overline{x} (x_{1} + x_{2} +・・・+ x_{n}) +n( \overline{x} )^2 \}$
$\displaystyle = \frac{1}{n} ( x_{1}^2 + x_{2}^2 +・・・+ x_{n}^2 ) -2 \overline{x} \frac{1}{n} (x_{1} + x_{2} +・・・+ x_{n} ) +( \overline{x} )^2$
$= \overline{x^2} -2 \overline{x} \cdot \overline{x} + ( \overline{x} )^2$
$= \overline{x^2} -2( \overline{x} )^2 +( \overline{x} )^2$
$= \overline{x^2} -( \overline{x} )^2$
このように,
$( x の分散)=(x^2 の平均値)-(x の平均値)^2$
となり, $x$ の分散は $x^2$ の平均値と $x$ の平均値の2乗の差から求めることもできる。
【発展】共分散②
$\displaystyle s_{xy} = \frac{1}{n} (x_{1} y_{1} + x_{2} y_{2} +・・・+ x_{n} y_{n}) – \overline{x} \cdot \overline{y}$
と表せる。
$x$ , $y$ の平均値を $\overline{x}$ , $\overline{y}$ とすると,
$\displaystyle \overline{x} = \frac{x_{1} + x_{2}+・・・+ x_{n}}{n}$ , $\displaystyle \overline{y} = \frac{y_{1} + y_{2} +・・・+ y_{n}}{n}$
共分散の定義より,
$\displaystyle s_{xy} = \frac{(x_{1} – \overline{x} )(y_{1} – \overline{y}) + (x_{2} – \overline{x})(y_{2} – \overline{y})+・・・+ (x_{n} – \overline{x})(y_{n} – \overline{y}}{n})$
ここで, $i=1,2,・・・,n$ に対して,
$(x_{i} – \overline{x})(y_{i} – \overline{y}) =x_{i} y_{i} – x_{i} \overline{y} – \overline{x} y_{i} + \overline{x} \overline{y}$
と変形できるので,
$\displaystyle s_{xy}= \frac{(x_{1} y_{1} -x_{1} \overline{y} – \overline{x} y_{1} + \overline{x} \cdot \overline{y} )+ (x_{2} y_{2} -x_{2} \overline{y} – \overline{x} y_{2} + \overline{x} \cdot \overline{y})+・・・+(x_{n} y_{n} -x_{n} \overline{y} – \overline{x} y_{n} + \overline{x} \cdot \overline{y})}{n}$
$\displaystyle = \frac{(x_{1} y_{1} + x_{2} y_{2} +・・・+x_{n} y_{n}) – (x_{1} + x_{2} +・・・+ x_{n}) \overline{y} – (y_{1} + y_{2} +・・・+ x_{n}) – \overline{x} (y_{1} + y_{2} +・・・+ y_{n}) +n \overline{x} \cdot \overline{y}}{n}$
$\displaystyle = \frac{x_{1} y_{1} + x_{2} y_{2} +・・・+ x_{n} y_{n}}{n} – \frac{x_{1} + x_{2} +・・・+ x_{n}}{n} \overline{y} – \overline{x} \frac{y_{1} + y_{2} +・・・+ y_{n}}{n} + \overline{x} \cdot \overline{y}$
$\displaystyle = \frac{x_{1} y_{1} + x_{2} y_{2} +・・・+ x_{n} y_{n}}{n} – \overline{x} \cdot \overline{y} – \overline{x} \cdot \overline{y} + \overline{x} \cdot \overline{y}$
$\displaystyle =\frac{1}{n} (x_{1} y_{1} + x_{2} y_{2} +・・・+ x_{n} y_{n}) – \overline{x} \cdot \overline{y}$