分散分析の前に等分散性の検定をすべきか

 最初に,この記事は自分のメモ代わりなので,文章は適当,内容の正当性はあまり保障出来ないのと,他人が見てもあまり役に立たないであろうことを断っておく.

 SPSSが入ってるパソコンが1台しかないので,MATLABでも統計は出来ないかと思っていたら"Statistics Toolbox"が入ってた.そして,"Statistics Toolbox"で用意されている関数を調べていたら(Statistics Toolbox),Bartlett検定用の関数があるらしい.分散分析など等分散が前提となっている検定法ではその等分散性をBartlett検定などの等分散性の検定を用いてから,等分散であると判断された場合,分散分析などを用いる(Bartlett(バートレット)検定).……と思ってたんだけど,どうやら違うらしい.

 等分散性の検定後に,その結果から分散分析などの検定を行うことは,検定の多重性の問題がある.検定の多重性というのは,統計検定を何度も繰り返すことで,第一種過誤率(偽陽性率)が大きくなってしまうということ.つまり,誤って有意であるという結果が出てしまう可能性が出てくる.もう1つ,もっと大事な問題があって,この方法では第二種過誤率(偽陰性)の可能性が第一種過誤に比べて高いということ.つまり,この検定で問題になるのは,第二種過誤率をどうするかである.それには,第一種過誤を減らす(有意水準を厳しくする)ことよりも,第二種過誤率を減らす(有意水準を甘くする)ことを考えなければならない.したがって,これらの問題を解決するために,有意水準を大きくしてやる.ネット上の文献によれば,有意水準を本来の4倍程度(p=0.05ならp=0.20にして検定)にするべきらしい.果たして,これで検定をする意味があるのか・・というのを考えると,やはり分散分析の前に等分散性の検定をする意味はあまりないと判断したほうが良いんだろう.

参考:

 統計解析Q&A-差の検定-

 一元配置分散分析

 平均値の差の検定

 等分散性の検定について

 予備検定の多重性について

 第一種過誤と第二種過誤


 というわけで,等分散性の検定の有意水準をp=0.20くらいに引き上げて使うか,いっそ等分散性の検定なんてせずに等分散を仮定しない検定方法を行ったほうが良いようだ.ただまあ,「やはり等分散性の検定をするべき」なんて主張をしている方もいるっぽいので,ぶっちゃけよく分からないところだが.

 統計解析や多変量解析って,SPSSやらいろいろな便利ツールがあるから簡単に使えてしまうけど,その実,確からしい結果を出すためには非常にいろいろと難しいことを考えないといけないなあ……ってね.細かい部分が不正確なので,文献をもう少し漁ってみよう.