2012年11月1日木曜日

クラスカル・ウォリスの検定をエクセルでやる

ノンパラメトリック検定の多重比較をするということであれば,パラメトリック検定の多重比較の際に行う「分散分析」に相当するものを紹介しておかないといけないなということで,今回はクラスカル・ウォリスKruskal Wallisの検定を取り上げます.

以前,
ノンパラメトリック版Tukey法による多重比較「Steel-Dwass法
Steel-Dwass法をExcelで計算する方法について,もう少し詳細に
という記事を書いていますが.
こちらではなく,どうしてもマン・ホイットニーのU検定での多重比較をエクセルでやりたい場合に利用してもらえると良いかと思います.

クラスカル・ウォリスKruskal Wallis(クラスカル・ワリスとも表記される)の検定.
対応のない3群以上のデータ間に有意性があるかどうか検定するものです.
パラメトリック検定である「一元配置分散分析」のノンパラメトリック版といったところです.

では,使用するデータの紹介です.
マン・ホイットニーのU検定(エクセルでp値を出す
でも紹介したように,群を立てに並べておくと,少しだけ作業が楽です.

上から順に,A群(赤セル),B群(青セル),C群(緑セル)です.
あと,A列のところにある数字は,各群のN数と「A14」に全N数を表示させています.
後ほど使用しますので.

次に,このデータの順位付け作業です.
RANK関数を使用し,昇順で
一気に順位付けします.
※同順位値(タイ値)がある場合の処理については,
Steel-Dwass法をExcelで計算する方法について,もう少し詳細に
ウィルコクソンの符号付順位和検定(エクセルでp値を出す)
を参考にしてください.

で,
今度は,図のようにそれぞれの群の「順位の値」を平均させます.
そして,全部のデータの順位の平均値も算出します.
これで準備完了です.

これを基に,クラスカル・ウォリスの統計量を計算します.
かなり長いので,参照しているところを図で確認してもらって,間違えないように入力してください.

=12/(A14*(A14+1))*((A3*((D6-C14)^2))+(A8*((D10-C14)^2))+(A12*((D13-C14)^2)))

この式の最初の「12」っていうのは,どんなデータであっても「12」です.どこかの参照値ではありません.

例では,統計量は「6.3949」になっています.

そして,p値を出すのですが,今回はエクセルのχ二乗検定の関数を利用します.
=CHIDIST(B16,2)

ということで,自由度を「2」にしてT(統計量)を参照します.
今回のデータ例であれば,0.0409という値が出ましたので,この3群間には有意性が認められました.

ちなみに,同データでのSPSSの算出結果は以下の通り.

このように,このデータについて群間に有意性が認められたということになりましたが,ではどことどこの群間に差があるのか?という点については,2群間のノンパラメトリック検定を行なわなければなりません.
今回のような対応のない2群間の検定としては,マン・ホイットニーのU検定などを使います.
マン・ホイットニーのU検定(エクセルでp値を出す

その後の多重比較には,
ノンパラメトリック検定で多重比較したいとき
Excelで多重比較まとめ
を参考にしてもらえるとOKです.

Steel-Dwass法を紹介していますので,あまり利用することは少ないかもしれませんが,何かの時に使ってください.

この記事の参考文献:
石村貞夫 著『すぐわかる統計処理』
池田央 著『統計ガイドブック』


※その他,こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書いています.参照してください.