【定義・定理・公式】高校数学基本事項 – 数学Ⅰ – データの相関

スポンサーリンク

相関関係

【定義】

散布図:2つの変量からなるデータを平面上に図示したもの

正の相関:2つの変量からなるデータにおいて,一方が増加すると他方が増加する傾向が見られること

負の相関:2つの変量からなるデータにおいて,一方が増加すると他方が減少する傾向が見られること

相関(相関関係)がない:正負の相関が見られないこと

相関の強弱:2つの変量の間に相関関係があるとき,散布図における点の分布の様子が1つの直線に接近しているほど相関が強いといい,散らばっているほど相関が弱いという

 

スポンサーリンク

相関係数

【定義】

共分散( $s_{xy} ):$x$ の偏差と $y$ の偏差の積 $(x_k- \overline{x} )(y_k- \overline{y} )$ の平均値

$s_{xy}= \displaystyle \frac{1}{n} \{ (x_1- \overline{x} )(y_1- \overline{y} )+(x_2- \overline{x} )(y_2- \overline{y} )+……+(x_n- \overline{x} )(y_n- \overline{y} ) \}$

$s_{xy}= \overline{xy}-\overline{x} \ \overline{y}$

相関係数( $r$ ):相関の正負と強弱を表す値

\begin{eqnarray}r &=& \displaystyle \frac{s_{xy}}{s_xs_y} \\ \ &=& \frac{ \frac{1}{n} \{ (x_1- \overline{x} )(y_1- \overline{y} )+(x_2- \overline{x} )(y_2- \overline{y} )+……+(x_n- \overline{x} )(y_n- \overline{y} ) \} }{ \sqrt{ \frac{1}{n} \{ (x_1- \overline{x} )^2+(x_2- \overline{x} )^2+……+(x_n- \overline{x} )^2 \} } \sqrt{ \frac{1}{n} \{ (y_1- \overline{y} )^2+(y_2- \overline{y} )^2+……+(y_n- \overline{y} )^2 \} }} \\ \ &=& \frac{ (x_1- \overline{x} )(y_1- \overline{y} )+(x_2- \overline{x} )(y_2- \overline{y} )+……+(x_n- \overline{x} )(y_n- \overline{y} ) }{ \sqrt{ \{ (x_1- \overline{x} )^2+(x_2- \overline{x} )^2+……+(x_n- \overline{x} )^2 \} \{ (y_1- \overline{y} )^2+(y_2- \overline{y} )^2+……+(y_n- \overline{y} )^2 \} }} \\ \ &=& \frac{ \overline{xy}-\overline{x} \ \overline{y}}{ \sqrt{(\overline{x^2} -( \overline{x} )^2)(\overline{y^2} -( \overline{y} )^2)}} \end{eqnarray}

※ $r$ の値が1に近いほど正の相関が強く,$-1$ に近いほど負の相関が強い。また,相関関係がないときは0に近い値をとる。

タイトルとURLをコピーしました