二元配置法

一元配置法では、他の要因を一定にして、一つの要因について様々な水準で比較検討する場合を考えました。では、要因を2つにした場合を下の例で考えていきましょう。

東京、大阪、名古屋、九州の4カ所の工場に一日に1万個の商品を製造する異なる機械A,B,Cがあり、一日に出現する不良品の個数を表にすると次のような結果が得られたとします。

  東京 大阪 名古屋 九州
A 1 3 1 0
B 5 6 7 10
C 3 0 4 5

この結果から、不良品を作り出す割合は、環境によって違うのか、また、機械によって違うのかを検討したいと思います。

まずは仮説から…。二元配置法の場合は次のように仮説を立てます。

帰無仮説:不良品を作り出す割合に環境および機械による差はない。

対立仮説:不良品を作り出す割合に環境または機械による差がある。

一元配置法の場合は、

”個人差のばらつき” = 各個人の平均 - 総平均
”誤差によるばらつき” = 各データ - 各個人の平均

から、

帰無仮説:”個人差のばらつきはなく、誤差のばらつきのみである。”

を棄却できるかどうかを考えました。

二元配置法の場合は、個人差のばらつきが、2通りあります。上の例でいうと、”環境によるばらつき”と”機械によるばらつき”です。この2通りのばらつきをどう処理していけばよいのでしょうか?

  東京 大阪 名古屋 九州 平均 環境によるばらつき
A 1 1 4 2 2 -2
B 5 7 7 9 7 3
C 3 1 4 4 3 -1
平均 3 3 5 5 4  
機械による ばらつき -1 -1 1 1    

これで2通りのばらつきがでました。この出し方は、一元配置法のときと同じ要領で考えたらいいです。

列(この場合、機械)によるばらつき = 列の平均 - 総平均

行(この場合、環境)によるばらつき = 行の平均 - 総平均

ってな具合です。誤差に関しても一元配置法のときと同じように考えると、

各データ = 総平均 + 列のばらつき + 行のばらつき + 誤差

と考え、変形して、

誤差 = 各データ - 総平均 - 列のばらつき - 行のばらつき

これを用いて、各データの誤差を出すと、下のようになります。

  東京 大阪 名古屋 九州
A 0 0 1 -1
B -1 1 -1 1
C 1 -1 0 0

ここで、機械によるばらつき、環境によるばらつき、誤差、のそれぞれの不偏分散を計算します。

”機械によるばらつき”の分散(自由度=4-1=3)

= {(-1)2×3 + (-1)2×3 + 12×3 + 12×3 }/(4-1)

= 4

”環境によるばらつき”の分散(自由度=3-1=2)

= {(-2)2×4 + (3)2×4 + (-1)2×4 }/(3-1)

= 28

”誤差によるばらつき”の分散{自由度=(行の数 - 1)(列の数 - 1)=6}

= {(0)2 + (-1)2 + 12 + 02 + 12 + (-1)2 + 12 + (-1)2 + 02 + (-1)2 + 12 + 02 }/{(4-1)(3-1)}

= 1.33

二元配置法の場合は、2つの要因に関して、差があるかどうかを考える必要があります。そのため、次の2通りの分散比を計算します。

F1 = ”機械によるばらつき”の分散/”誤差によるばらつき”の分散
F2 = ”環境によるばらつき”の分散/”誤差によるばらつき”の分散

ここでそれぞれの不偏分散の比F1,F2

F1 = 4/1.33 = 3

F2 = 28/1.33 = 21

自由度が3および6のF分布表の値は有意水準0.05のとき4.76( > 3)。

自由度が2および6のF分布表の値は有意水準0.05のとき5.14( < 21)。

よって機械によりばらつきがあるとは言えないが、環境によるばらつきには有意差が認められることになります。

 二元配置法