第12章 マーケティング・リサーチと解析手法
[データの基本2] 推定と検定
推定
クロス集計の説明で、「日ごろワインを飲む人は四〇%」という結果を例に挙げましたが、この結果は回収されたサンプルの比率であって、必ずしも母集団(例:日本人全体)全員に調査した比率と一致するとはいえません。サンプル結果から統計的手法を用いて母集団結果を予測することを「推定」と呼びます。
ここでは数学的な説明はしませんが、例えば先ほどの数値を上記数式に当てはめると、“信頼度九五%で三七%〜四三%の間に母集団の比率は存在する”と推定されます。この比率の推定は、サンプル数をいくらにすればいいのかを判断する時にも用いられます。数式からわかるように、nが小さければ小さいほど推定区間は大きくなってしまいます。サンプル数や回答比率を色々変化させ、予算の制約も考えながら最終的なサンプル数を決定することになります。
検定
先のクロス集計の中で、“日ごろワインを飲む比率は男性三五%、女性四五%であり、女性の方がよく飲む”という結果を示していましたが、本当にそういるのか(差があるのか)について判断することを、「検定(有意性検定)」と呼びます。
推定同様、数学的な話は省きますが、先の調査結果を検定仮説として、その仮説が誤りである確率(危険確率)を求めて判断することになります。通常は危険率五%あるいは一%と設定して判断しますが、今回の調査結果を基にした検定仮説の危険確率は〇.〇一四%ということになり、十分有意差ありと判断されます。なお危険確率は、サンプル比率の差が大きいほど、結果的に小さくなります。