2012年6月19日火曜日

繰り返し数(N数)が異なる群を,Excelを使ってTukey法で多重比較する

長いタイトルになり,長い月日が経過しましたが,そういうことをしてみたいと思います.
いわゆるTukey-Kramer(テューキー・クレーマー)法というやつです.

繰り返し数(N数)が同じ群でのTukey法による多重比較は,3ヶ月前に書いた
ExcelでTukey法による多重比較
をご覧ください.

というか,その続きとして書きますので,以下のエクセルの作業状況を写した画像を見て意味不明な人は,先に上記の記事を読むことを強くオススメします.


上記の画像は,
F12の【35.24】という値よりも,C12~17に示した値が大きれば,そこの組み合わせに有意性が認められる,ということを示したものです.
具体的には,A群とC群,C群とD群に有意性が認められています.


では,以下のような繰り返し数が異なるデータであれば,どのような計算をするのでしょうか?
というのが,今回の内容です.

以前のデータと違い,A群は5群,B群とC群は6群,D群は4群です.
以前紹介したTukey法ですと,全ての計算式を 【N数は5】 ということで統一していますので,今回のようにN数が異なる場合には採用できません.

以前のKramer法で用いる5%水準は,【スチューデント化された範囲の表】における,
※以下,その「表」.クリックしたら大きなサイズで見れます.

群数: 4
ν(データ数): 5
である,「 5.22 」を採用していましたが,今回のTukey-Kramer法では「ν」を,

総データ数 - 群数

の数値で読みとります.
今回の例題ですと,

21 - 4群 = 17

ですので,

群数: 4
ν: 17

である「4.02」を採用します.

以下がそのエクセルの画像です.
あと,C13~C18までの各群の組み合わせについては,以前と同様,平均値の引き算をABS関数で絶対値にしています.

で,この各群間の「平均値の差」を検定する「統計量」の計算式ですが,各群のN数が異なるので前回のような式では算出できません.
なので,組み合わせ毎に式の中でN数の違いを考慮したものを使います.

エクセルに入力するものとしては,

=4.02(表の値) × SQRT(分散の平均値 × (1÷i群のN数 + 1÷j群のN数))

です.
「i群」とか「j群」っていうのは,比較しようとしている2群のことを表しています.

順に,その式と入力済み画像を出していきます.

A群とB群
=F12*SQRT(G10*(1/5+1/6))

A群が5,B群は6だから,それに対応していることが分かるかと思います.


次はA群とC群
=F12*SQRT(G10*(1/5+1/6))

ここは条件は一緒だから,算出された値は変わりません.


A群とD群
=F12*SQRT(G10*(1/5+1/4))

ここはD群のN数が4なので,そのようになっています.


B群とC群
=F12*SQRT(G10*(1/6+1/6))

どちらもN数は6です.


B群とD群
=F12*SQRT(G10*(1/6+1/4))

こんな感じです.


最後にC群とD群
=F12*SQRT(G10*(1/6+1/4))


これらの値と,先に計算した「平均値の差」とを比べてみましょう.
これらの値よりも,「平均値の差」の方が大きければ,その組み合わせに有意性が認められるということです.

有意性が認められる組み合わせを赤字にしてみました.

さて,
例によって,Tukey法の算出方法はもう一つのあります.
多くは語りません.以下のようになります.
=C13/SQRT(G10*(1/5+1/6))

以降,先に紹介した計算式と同様です.
念のため,どのような計算をしているか書いておくと,

= ( i群平均値 - j群平均値 ) ÷ SQRT(分散の平均値 × (1÷i群のN数 + 1÷j群のN数))

この式で算出された値が,「スチューデント化された範囲の表」から取り出した【4.02】よりも大きければ,その組み合わせが有意であるということです.

式のカタチが違うだけで,算出しようとしていることは違いませんので,当たり前ですが結果は変わりません.
そんなわけで,以上です.

参考になるかもしれない関連記事を以下に示しておきます.
ExcelでTukey法による多重比較
ノンパラメトリック検定で多重比較したいとき
ノンパラメトリック版Tukey法による多重比較「Steel-Dwass法」
エクセルExcelでの簡単統計(対応のあるt検定と多重比較)
Excelで多重比較まとめ
スチューデント化された範囲の表の補間

※統計的有意にこだわらないのであれば,
効果量(SE:effect size)をエクセルで算出する
がオススメです.

※後日,こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書きました.参照してください.