連続型確率変数
【定義】
連続型確率変数:連続した値を取る確率変数
離散型確率変数:とびとびの値をとる確率変数
分布曲線:連続型確率変数 $X$ に対応させた曲線
確率密度関数:分布曲線 $y=f(x)$ における $f(x)$
連続型確率変数の期待値・分散・標準偏差
連続型確率変数 $X$ のとる値の範囲が $\alpha\leqq X\leqq\beta$ で,その確率密度関数が $f(x)$ であるとき,$X$ の期待値 $m=E(X)$,分散 $V(X)$,標準偏差 $\sigma(X)$ を次の式で定める。
- $m=E(X)=\int_{\alpha}^{\beta}xf(x)dx$
- $V(X)=\int_{\alpha}^{\beta}(x-m)^2f(x)dx$
- $\sigma(X)=\sqrt{V(X)}=\sqrt{\int_{\alpha}^{\beta}(x-m)^2f(x)dx}$
【定理】
確率密度関数の性質
確率密度関数 $f(x)$ について
- 常に $f(x)\geqq0$
- $P(a\leqq X\leqq b)=\int_{a}^{b}f(x)dx$
- $X$ のとる値の範囲が $\alpha\leqq X\leqq\beta$ のとき $\int_{\alpha}^{\beta}f(x)dx=1$
正規分布
【定義】
正規分布曲線・正規分布
$m$ が実数,$\sigma$ が正の実数,$e$ が自然対数の底のときの曲線
$y=f(x)=\displaystyle\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-m)^2}{2\sigma^2}}$
を正規分布曲線といい,連続型確率変数 $X$ の確率密度関数が正規分布曲線の関数 $f(x)$ のとき,$X$ の確率分布を正規分布という。
このとき,$X$ は正規分布 $\boldsymbol{N(m,\sigma^2)}$ に従うといい,期待値 $E(X)$ と標準偏差 $\sigma(X)$ は
$E(X)=m$
$\sigma(X)=\sigma$
標準正規分布
正規分布 $N(0,1)$ を標準正規分布という。
確率変数 $X$ が正規分布 $N(m,\sigma^2)$ に従うとき,$Z=\frac{X-m}{\sigma}$ とおくと,確率変数 $Z$ は標準正規分布 $N(0,1)$ に従う。
標準正規分布 $N(0,1)$ に従う確率変数 $Z$ の確率密度関数 $f(z) は
$f(z)=\displaystyle\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}$
また,一般に確率 $P(0\leqq Z\leqq u)$ を $P(0\leqq Z\leqq u)=p(u)$ と表す。
標準化:正規分布を標準正規分布に直すこと
【定理】
正規分布に従う確率変数の分布曲線の性質
確率変数 $X$ が正規分布 $N(m,\sigma^2)$ に従うとき,$X$ の分布曲線 $y=f(x)$ は次のような性質をもつ。
- 直線 $x=m$ に関して対称であり,$y$ は $x=m$ で最大値を取る。
- $x$ 軸を漸近線とし,$x$ 軸と分布曲線の間の面積は1である。
- 標準偏差 $\sigma$ が大きくなると曲線の山は低くなって横に広がる。
- 標準偏差 $\sigma$ が小さくなると曲線の山は高くなって直線 $x=m$ の周りに集まる。
二項分布と正規分布
$q=1-p$ とする
- 二項分布 $B(n,p)$ に従う確率変数 $X$ は,$n$ が大きいとき,近似的に正規分布 $N(np,npq)$ に従う。
- 二項分布 $B(n,p)$ に従う確率変数 $X$ に対し,$Z=\frac{X-np}{\sqrt{npq}}$ は,$n$ が大きいとき,近似的に標準正規分布 $N(0,1)$ に従う。