母集団と標本
【定義】
全数調査:対象全体からデータを集めて調べる統計的な調査
標本調査:対象全体から一部を抜き出して調べる統計的な調査
母集団:標本調査の対象全体
個体:母集団に属する個々の対象
母集団の大きさ:個体の総数
標本:調査のために母集団から抜き出された個体の集合
標本の大きさ:標本に属する個体の総数
抽出:母集団から標本を抜き出すこと
無作為抽出:母集団の各個体を等しい確率で抽出する方法
※無作為抽出では,乱数さいや乱数表などが使われる。
復元抽出:毎回元に戻しながら個体を1個ずつ抽出すること
非復元抽出:個体をもとに戻さないで抽出すること
無作為標本:無作為抽出によって選ばれた標本
統計的な調査対象の特性:身長,時間,不良品などの特定の性質
変量:ある特性を表す数量
母集団分布:母集団における変量 $x$ の分布
母平均( $m$ ):母集団における変量 $x$ の平均
母標準偏差( $\sigma$ ):母集団における変量 $x$ の標準偏差
※大きさ1の無作為標本について,変量 $x$ の値を確率変数と見たときの期待値,標準偏差は,母平均 $m$,母標準偏差 $\sigma$ と一致する。
標本平均と標本比率
【定義】
標本平均( $\overline{X}$ )
母集団から大きさ $n$ の無作為標本を抽出し,それらの変量 $x$ の値を $X_1,X_2,\cdots\cdots,X_n$ とするとき
$\overline{X}=\displaystyle\frac{X_1+X_2+\cdots\cdots+X_n}{n}$
標本平均の期待値( $E(\overline{X})$ )・標準偏差( $\sigma(\overline{X})$ )・分布
母平均 $m$,母標準偏差 $\sigma$ の母集団から大きさ $n$ の無作為標本を抽出するときの標本平均を $\overline{X}$ とすると
$E(\overline{X})=m$
$\sigma(\overline{X})=\displaystyle\frac{\sigma}{\sqrt{n}}$
また,$\overline{X}$ は $n$ が大きとき,近似的に正規分布 $N(m,\frac{\sigma^2}{n})$ に従う。
すなわち,確率変数 $Z=\frac{\overline{X}-m}{\frac{\sigma}{\sqrt{n}}}$ は近似的に標準正規分布 $N(0,1)$ に従う。
母比率:母集団の中である特性をもつものの割合
標本比率:抽出された標本の中である特性を持つものの割合
※ある特性の母比率 $p$ の母集団から抽出された大きさ $n$ の無作為標本について,標本比率 $R$ は $n$ が大きいとき,近似的に正規分布 $N(p,\frac{pq}{n})$ に従うとみなすことができる。
大数の法則
【法則】
母平均 $m$ の母集団から大きさ $n$ の無作為標本を抽出するとき,$n$ が大きくなるに従ってその標本平均 $\overline{X}$ は母平均 $m$ に近づく。
母平均の推定
正規分布表によると $P(|Z|\leqq1.96)=0.95$ であるから
$P\left(|\overline{X}-m|\leqq1.96\cdot\displaystyle\frac{\sigma}{\sqrt{n}}\right)=0.95$
このことから,標本の大きさ $n$ が大きいとき,母平均 $m$ に対する
信頼度95%の信頼区間は $\left[\overline{X}-1.96\cdot\displaystyle\frac{\sigma}{\sqrt{n}},\overline{X}+1.96\cdot\frac{\sigma}{\sqrt{n}}\right]$
母平均 $m$ に対して信頼度95%の信頼区間を求めることを,「母平均 $m$ を信頼度95%で推定する」ということがある。
母比率の推定
正規分布表によると $P(|Z|\leqq1.96)=0.95$ であるから
$P\left(|R-p|\leqq1.96\sqrt{\displaystyle\frac{p(1-p)}{n}}\right)=0.95$
このことから,標本の大きさ $n$ が大きいとき,大数の法則により $R$ は $p$ に近いとみなしてよいから,母比率 $p$ に対する
信頼度95%の信頼区間は $\left[R-1.96\sqrt{\displaystyle\frac{R(1-R)}{n}},R+1.96\sqrt{\displaystyle\frac{R(1-R)}{n}}\right]$