一部の標本から母平均を推定しようとするとき、一般に区間推定を行うことが多いようです。母平均の区間推定には次の2通りが考えられます。
区間推定の場合、事前に適当なα( 0 < α < 1 )を決めておき、
P(L<推定量<U) = 1-α
となるLおよびUを得ます。区間[L,U]を(1-αの信頼区間)または(100(1-α)%の信頼区間)といい、信頼の精度100(1-α)%を信頼度といいます。
P(L<推定量<U) = 1-αのとき |
|
(1-αの信頼区間)または(100(1-α)%の信頼区間)
|
区間[L,U] |
信頼度
|
100(1-α)% |
母集団を正規分布と仮定し、母平均をμ、母分散をσ2、標本平均をx~とおくと、信頼区間が
x~-σ/√n≦μ≦x~+σ/√n
のとき、信頼度は68.26%でした。同様に、
信頼区間、x~-2σ/√n≦μ≦x~+2σ/√n
のとき、信頼度は、95.44%、
信頼区間、x~-3σ/√n≦μ≦x~+3σ/√n
のとき、信頼度は、99.73%となります。⇒参照
では、信頼度100(1-α)%のときの信頼区間を出すにはどのようにすればいいのでしょうか?
それには、事前にαまたは100(1-α)を決めておいて、そのとき、
が成り立つなら、知りたいのは、k の値です。これは正規分布表からでるわけですが、よく使うところでいいますと、
信頼度
|
k
|
99% (α=0.01)
|
2.58 |
95% (α=0.05)
|
1.96 |
90% (α=0.10)
|
1.65 |
となります。
母分散が既知のときの例
|
1学年1000人の学校で、100点満点の共通テストを行い母集団の標準偏差は5でした。この学年より無作為に選ばれた10人の点数は次のようでした。 |
標本平均 = (70+50+30+75+40+60+90+35+40+80)/10 = 57 |
母分散が未知のときは不偏分散で代用しますが、k の値を出すときデータ数が多いか少ないかで、それぞれ正規分布、t分布を使い分ける必要があります。
不偏分散ux2は
ux2 = 1/(n-1)・Σ(xi - x~)2
= 1/(n-1)・Σ(xi2 - 2xix~ + x~2)
= 1/(n-1)・(Σxi2 - 2x~Σxi + Σx~2)
= 1/(n-1)・Σxi2 - 2/(n-1)・x~Σxi + 1/(n-1)・Σx~2
= 1/(n-1)・Σxi2 - 2n/(n-1)・x~Σxi/n + 1/(n-1)・nx~2
= 1/(n-1)・Σxi2 - 2n/(n-1)・x~・x~ + n/(n-1)・x~2
= 1/(n-1)・Σxi2 - n/(n-1)・x~2
= (Σxi2 - nx~2 )/(n-1)
と変形できるので、あとは母分散を使用したときと同様にして、
ここで注意しないといけないのは、データ数が多い場合(30以上)は正規分布表、データ数が少ない場合(30以下)はt分布表を利用するということです。
母分散が未知のときの例
|
1学年1000人の学校で、100点満点の共通テストを行い、この学年より無作為に選ばれた10人の点数は次のようでした。 |
上と同じ例ですが、母標準偏差が分かっていません。このとき |