分散分析統計学入門

これまで１つまたは２つの母集団のデータを比較してきましたが、ここでは３つ以上の母集団の解析を行っていきます。

例として鎮痛剤をあげます。鎮痛剤には多くの種類があり、その適応は様々です。

ここで、３本以上抜歯適応の歯を有する歯周病患者A,B,Cの３人に関して、抜歯後すぐに鎮痛剤を服用させ、次に痛みが出るまでの時間を表にすると下のようになったとします。（ただし、３本の抜歯はそれぞれ１本ずつ行い、前回抜歯した部位が完全に治癒してから次の抜歯を行うものとする。）

つまり、この実験はある鎮痛剤に関して、その効果が出ている時間に個人差があるかどうかを検討しているわけです。

薬剤の効果を客観的に評価するのは、非常に難しいもので、例えば痛みを余り感じない人や非常に敏感な人もいますし、抜歯する歯が非常に抜きにくいもので施術に長時間を要する場合もあります。また術者の技量にもよります。

この場合、Aは平均が８時間なので鎮痛剤が長く効いている人、Bは平均５時間で鎮痛剤の効果が短い人と一概に判断はできません。上のような理由で歯や体調、全身状態などによって鎮痛剤の効果は大きく異なるからです。

ではこのような複雑なデータをどのような方針で解析していけばいいのでしょうか？

まず、各個人の理想的なデータを考えます。下の表を見てみましょう。

このような結果が毎回、得られるのであれば、データの評価は単純なものでしょう。この表の各データから総平均7を引いたものを表にします。

これを”個人差のばらつき”と考えることにします。

”個人差のばらつき” = 各個人の平均 - 総平均

次にそれぞれのデータを各個人の平均で引いた値を表にします。

このばらつきは、歯や体調、全身状態で左右される、”誤差によるばらつき”です。

”誤差によるばらつき” = 各データ - 各個人の平均

つまり各データを次のように分解して考えてるわけです。

各データ = 総平均 + ”個人差のばらつき” + ”誤差によるばらつき”

ここで仮説を立てます。

｛データのばらつきに、”個人差のばらつき”はなく、”誤差のばらつき”のみである。｝

この仮説が棄却できれば、個人差にばらつきがあることになり、鎮痛剤の効果に個人差があることになります。