統計学の基本概念

<母集団と標本>

私たちが統計的なデータを有する対象の情報を得たいとき、その全体を母集団(population)といい、母集団から抽出された一部を標本(sample)といいます。母集団の情報を得るときに、標本調査を行い、母集団を評価したりします。ただ、標本から得た情報が必ずしも母集団の特徴を反映しているとは限りません。

母集団を完全に正しく知るためには、すべてのデータについての調査が必要となるわけです。これを全数調査と呼び、国勢調査が良い例です。全数調査は、確かに母集団を把握する上で、確実な方法といえますが、これには多くのコストと時間を費やす必要があります。たとえば、缶詰を製造している会社が不良品がないかどうかを調査するとき、生産するすべての缶詰を開けて確認するようなことはしません。これには、無作為抽出によりサンプリングされた商品について調べるわけです。これを標本調査といいます。

できるだけ母集団を、一部の標本より評価したいという試みが統計学において重要です。

そのため、標本抽出(sampling)は、無作為(random sampling)に行われる必要があり、偏りを生じてはならないのです。しかし、たとえば母集団の平均(母平均という)が、標本平均と必ずしも一致しているとは限りません。このような誤差を標本誤差といいます。これに対して、偏った標本抽出において、母平均と標本平均などが一致しないことを非標本誤差といいます。標本誤差は統計的にその大きさを評価することができますが、非標本誤差は統計的評価が不可能です。では、これらの集団をどのように評価するのでしょうか?これには主に、平均と分散が利用されます。平均で、集団を代表する数値とし、分散で集団の散らばりを知ります。

 

 

<母数と統計量>

母集団の統計学的指標として、母平均や母分散などがあげられます。これらを総称して、母数と呼びます。これに対して、標本の統計学的指標(標本平均や標本分散など)は統計量といいます。

 

 統計学の基本概念