2012年3月30日金曜日

ノンパラメトリック版Tukey法による多重比較「Steel-Dwass法」

前回はスチューデント化された範囲を用いた多重比較検定であるテューキー法(Tukey法)を紹介しました.
Tukey法はパラメトリックな処理によるものですが,これをノンパラメトリックに処理できないかということで,スティール・ドゥワス(Steel-Dwass法)というものが考案されています.

今回は,Steel-Dwass法をExcelで処理する方法を紹介します.
以前にもノンパラメトリックの多重比較法を
ノンパラメトリック検定で多重比較したいとき
で取り上げましたが,その延長ということです.

その関連記事として,後日,
マン・ホイットニーのU検定(エクセルでp値を出す)
ウィルコクソンの符号付順位和検定(エクセルでp値を出す)
も載せました.ご参照ください.

Tukey法やSteel-Dwass法のメリットは,予め分散分析による有意性の確認をしなくても大丈夫という見解が多く,いきなり多重比較に取り掛かれる強者です.


さっそくやってみましょう.
以下が使用するデータですが,
ノンパラメトリック検定ですから,これを順位(rank)として処理する必要があります.

【 A-B,A-C,B-C 】という3通りの比較をノンパラメトリックとして処理したのが下の図です.
比較する2群でデータを昇順or降順で並べ,それに順位をつけます.
それを再度2群に分け直したものということです.
データに順位を付けて並べ直したら,その順位の数値を合計します.
A-Bの比較であれば,A群は20になっていますね.
ちなみに,2群の内,どちらか一方の群の順位を合計すればOKです.

では次に,Steel-Dwass法に必要な統計量を用意していきましょう.
C列26番目の「E」のところは,

= N数 × (2×N数+1)÷2

を計算します.
例では,N数は「5」ですので,

=5*(2*5+1)/2

と入力しています.
そして,
C列27番目の「V」のところは,

=N数×N数×(2×N数+1)÷12

を計算します.
例では,

=5*5*(2*5+1)/12

と入力しています.
E=27.5,V=22.9
となります.

各群を比較した統計量の計算は,
A群とB群の比較であれば,F列26番目のところに,

=ABS(C8-C26)/SQRT(C27)

と入れています.
その調子で他の2つのところも入れていってください.

A-C比較: =ABS(C16-C26)/SQRT(C27)
B-C比較: =ABS(C24-C26)/SQRT(C27)

ここで出てきた数値を見て有意かどうかを判断するのですが,その比較判断材料である数値は,
【スチューデント化された範囲の表】を使って計算します.
以下に【スチューデント化された範囲の表】を置いておきます.クリックすれば大きくなるので,それを落として利用ください.
上が5%水準,下が1%水準の表です.

※後日,この「スチューデント化された範囲」の表に載っていない値を算出する方法を記事にしました.
スチューデント化された範囲の表の補間
本格的にTukey法やSteel-Dwass法で統計処理作業をするつもりでいるのなら大事なことなので,参考にしてください.


ここで使う数値は,群の数とνが∞のところを見てください.例は3群ですので,3群と∞の部分ということで5%水準の表であれば,「3.31」ということになります.
例では,この「3.31」をC列30番目のセルに入力し,F列30番目のセルに,

=C30/SQRT(2)

を入れて計算しています.
ここで出た数値よりも,F列26~28番目で計算した数値が大きければ,そこには有意性が認められるということになるのです.

ということで,Steel-Dwassの結果は以下の通りです.
A群とC群の比較に有意性が認められました.

さて,前回の
ExcelでTukey法による多重比較
でも触れましたが,このTukey法には算出方法が2つあります.
Steel-Dwass法も然りですので,こっちでも紹介しておきます.


F列26~28番目の計算が異なります.
その計算式は以下のようなものです.
A群とB群の比較であれば,

=ABS(C8-C26)

ということになり,以下,
A-C比較: =ABS(C16-C26)
B-C比較: =ABS(C24-C26)
と続きます.

有意性を判断する数値は,
スチューデント化された範囲の表から3群・∞のところの数値である「3.31」と「V」を使って,

=C30*SQRT(C27/2)

を計算します.
もう一つの算出方法と同様,この数値よりもF列26~28番目のセルで算出した数値よりも大きければ有意性が認められるという寸法です.

以下,結果です.
算出方法が違うだけですので,当たり前ですが結果は一緒になります.


前回のTukey法のところでも書きましたが,Tukey法もSteel-Dwass法も各群のデータ数(繰り返し数)が一緒でなければ計算できません.
ですが,多くの統計処理ソフトでは計算してくれてしまいます.

また,Steel-Dwass法に限らず,ノンパラメトリック検定はデータに順位を付けて計算しますが,同じ数値であればどうするのか?といった疑問もあるでしょう.

機会があれば,紙面をかえてその計算方法をやってみようと思います.

※というわけで,その後,データ数(繰り返し数)が違う群や同順位データが含まれるものでも計算できる方法を掲載しました.
Steel-Dwass法をExcelで計算する方法について,もう少し詳細に
繰り返し数(N数)が異なる群を,Excelを使ってTukey法で多重比較する
こちらも合わせてご覧ください.

統計的有意にこだわらないのであれば,
効果量(SE:effect size)をエクセルで算出する
がオススメです.

※後日,こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書きました.参照してください.


エクセルや手計算でTukeyやSteel-Dwassによる多重比較をしたい方は,以下の2冊がオススメです.