母平均の区間推定

一部の標本から母平均を推定しようとするとき、一般に区間推定を行うことが多いようです。母平均の区間推定には次の2通りが考えられます。

母分散が既知のとき

母分散が未知のとき

区間推定の場合、事前に適当なα( 0 < α < 1 )を決めておき、

P(L<推定量<U) = 1-α

となるLおよびUを得ます。区間[L,U]を1-αの信頼区間)または(100(1-α)%の信頼区間)といい、信頼の精度100(1-α)%を信頼度といいます。

P(L<推定量<U) = 1-αのとき

(1-αの信頼区間)または(100(1-α)%の信頼区間)
区間[L,U]
信頼度
100(1-α)%

 

<母分散が既知のとき>

母集団を正規分布と仮定し、母平均をμ、母分散をσ2、標本平均をx~とおくと、信頼区間が

x~-σ/√n≦μ≦x~+σ/√n

のとき、信頼度は68.26%でした。同様に、

信頼区間、x~-2σ/√n≦μ≦x~+2σ/√n

のとき、信頼度は、95.44%、

信頼区間、x~-3σ/√n≦μ≦x~+3σ/√n

のとき、信頼度は、99.73%となります。⇒参照

では、信頼度100(1-α)%のときの信頼区間を出すにはどのようにすればいいのでしょうか?

それには、事前にαまたは100(1-α)を決めておいて、そのとき、

が成り立つなら、知りたいのは、k の値です。これは正規分布表からでるわけですが、よく使うところでいいますと、

信頼度
k
99% (α=0.01)
2.58
95% (α=0.05)
1.96
90% (α=0.10)
1.65

となります。

 

母分散が既知のときの例
1学年1000人の学校で、100点満点の共通テストを行い母集団の標準偏差は5でした。この学年より無作為に選ばれた10人の点数は次のようでした。

70、50、30、75、40、60、90、35、40、80

このとき、母平均の信頼度95%の信頼区間は?

標本平均 = (70+50+30+75+40+60+90+35+40+80)/10 = 57

信頼度95%のときの k の値は1.96なので、信頼区間は、

57-1.96√(52/10)≦母平均≦57+1.96√(52/10)

57-3.1≦母平均≦57+3.1

53.9≦母平均≦60.1

これが求める母平均の信頼度95%の信頼区間です。

<母分散が未知のとき>

母分散が未知のときは不偏分散で代用しますが、k の値を出すときデータ数が多いか少ないかで、それぞれ正規分布、t分布を使い分ける必要があります。

不偏分散ux2

ux2 = 1/(n-1)・Σ(xi - x~)2

= 1/(n-1)・Σ(xi2 - 2xix~ + x~2)

= 1/(n-1)・(Σxi2 - 2x~Σxi + Σx~2)

= 1/(n-1)・Σxi2 - 2/(n-1)・x~Σxi + 1/(n-1)・Σx~2

= 1/(n-1)・Σxi2 - 2n/(n-1)・x~Σxi/n + 1/(n-1)・nx~2

= 1/(n-1)・Σxi2 - 2n/(n-1)・x~・x~ + n/(n-1)・x~2

= 1/(n-1)・Σxi2 - n/(n-1)・x~2

= (Σxi2 - nx~2 )/(n-1)

と変形できるので、あとは母分散を使用したときと同様にして、

ここで注意しないといけないのは、データ数が多い場合(30以上)は正規分布表、データ数が少ない場合(30以下)はt分布表を利用するということです。

 

母分散が未知のときの例
1学年1000人の学校で、100点満点の共通テストを行い、この学年より無作為に選ばれた10人の点数は次のようでした。

70、50、30、75、40、60、90、35、40、80

このとき、母平均の信頼度95%の信頼区間は?

上と同じ例ですが、母標準偏差が分かっていません。このとき

標本平均 = (70+50+30+75+40+60+90+35+40+80)/10 = 57

不偏分散

= {(702+502+302+752+402+602+902+352+402+802)-10×572}/(10-1)

= 440

ここで注意しなければならないのは、データ数が10であるので、t分布表を利用するということです。自由度(10-1)の信頼度95%のときの k の値は2.262なので、信頼区間は、

57-2.262√(440/10)≦母平均≦57+2.262√(440/10)

57-15.0≦母平均≦57+15.0

42.0≦母平均≦72.0

これが求める母平均の信頼度95%の信頼区間です。

 母平均の区間推定