アンケートは統計学的に正しくなければならない

 マスコミはアンケート調査やら世論調査やらが好きで,よく調査結果を公表する.……のだが,適当にアンケートして適当に発表しているものが多く,「これだけ差がある!!」といいつつ,実は統計学的に有意な差があるとは言えないものも多い.また,余談ではあるが,マスコミの世論調査は質問項目に問題があり,各マスコミがそれぞれ行った世論調査の結果が大きく異なるものも多い.例えば,関連[1]などを参照して欲しい.ちなみに,関連[1]での議論をより厳密に行う場合は,分散分析を用いるべきである.ただ,区間推定だけでも「同じ母比率を推定してるのに・・」ってう雰囲気は分かるし,計算した場所が病院のロビーで手間な計算は出来ない・・ということでご了承願いたい.

 で,アンケートでよくある,「A地区では52%だったが,B地区では49%だった」という結果.これが,果たして有意な差があるといえるのかどうか.多くの記事では,ただ数値上の比較だけ議論しているが,当然,アンケートというのは数億という母集団を数千人のサンプルで推定しているだけに過ぎない.したがって,統計誤差(標準誤差)を考えなければいけない.そして,それを考慮して推定するのが母比率の区間推定であり,母比率の区間推定を考えれば,2つの値(A地区とB地区のパーセンテージ)に有意な差はあるのか議論できる.

 区間推定は,一般的にt分布を仮定して推定する.その式は,「Waldの式」であり,次のように与えられる.

     p±z(α/2) × { p × (1 - p) ÷ N}1/2

z(α/2)は統計量tであり,95%信頼区間の場合,「1.96」(サンプルサイズが十分に大きい場合)という値になる.

 上式を用いれば,95%の信頼性で母集団を推定できるということになる.言い換えれば,95%確率で,母比率はその区間に存在することが言える.そして,これを利用すれば,2つの結果に有意な差があるかどうかを判断することが出来る.方法としては,2つの結果の差を95%信頼区間で推定する.そして,それが推定された区間内で0の値を取る場合,2つの母比率に有意な差はないといえる.

 これは,当たり前の話で,95%の確率で母比率はその区間内に存在すると推定されている.そして,母比率の差を95%信頼区間で推定して,区間内で0を取るということは,「95%の確率で,母集団の比率に差はない」ということになる.

 実例としては,関連[1]のマスコミ各社の世論調査の結果を参考にして欲しい.いくつかのマスコミは明らかに有意な差がある.同じ,「日本国民の世論」を推定しているにもかかわらずだ.このことから,アンケート項目が恣意的である.回答結果にバイアスかかってしまうような駄目なアンケートである・・などの要因が考えられる.端的に言えば,「駄目なアンケートをしている奴がいる」ということが分かる.

 マスコミのアンケートいうのはすぐに信用してしまいがちだが,その実,必ずしも確からしいとは云えないもののほうが多い.そのため,注意して読まなければならないだろう.

関連:
[1] 各新聞社の世論調査結果が大きく異なることに関して