2012年9月12日水曜日

対応のある相関係数の差の検定

先日,読者よりメールで質問をいただきました.
の記事で紹介しているやつの「対応のあるデータ版」を紹介してほしい,とのことでした.

統計学の本で比較的よく紹介されているのは上記の記事の方法です.
なかなか“対応のある”相関係数の差の検定は紹介されていません.

メール返信をしなきゃいけないという理由もできたし,これをいい機会にと一念発起.
Excelでなんとかできないものかと調べてみました.

というわけで,今回はその対応のある相関係数の差の検定をexcelでなんとかするというテーマです.


まず,例になるデータは以下のようなもの.
子供の給料と相関が高いのは「父親」と「母親」のどちらの給料なのか?を知りたい,という設定です.
その相関係数を出してみたところ,それが以下のようなものだったとします.
どうやら子供(A)と母親(C)の相関は0.73であり,父親(B)との相関である0.53よりも高いような気がしますね.
統計学的にもそう言えるかどうか,計算してみましょう.
※ちなみに,この対応のある検定のためには,「B(父親)とC(母親)」の相関係数も出しておく必要があります.

とういうわけで,先に分析結果を出します.
以下のような計算をしたところ,「AとB」の相関係数と「AとC」の相関係数には有意な差が認められました.

では,どんな計算をしているのか紹介していきます.
まずB列13行目の「行列式」のところ.
ここでは,
=(1-B7^2-B8^2-B9^2)+2*B7*B8*B9

という計算をしています.

次にB列14行目ではt値を算出しています.
=ABS(B7-B8)*SQRT((B6-1)*(1+B9))/SQRT(2*B13*(B6-1)/(B6-3)+(B7+B8)^2*(1-B9)^3/4)

かなり長いので,間違えずにコピーしてください.
まったく同じExcelシートを作ることをお勧めします.そうすれば,上記の関数をコピーすればOKということにできますので.

最後に,そのt値からp値を出す「TDIST」関数です.
=TDIST(B14,B12,2)

あと,自由度っていうのはN数から-3をした値でして,別に特殊なことをしているわけではないです.

そういうような感じで,対応のある相関係数の差の検定をしていただければと.

参考文献:池田央『統計ガイドブック』


子供の学歴や年収は,親のそれと相関する,というのはよく聞く話です.
なのでこんな例にしてみました.

内田樹 著『街場の現代思想』の冒頭でも紹介されていますが,子供の勉強時間やTVゲームやってる時間というのは,その「母親」の学歴と強い相関があるようで.
※その引用元は苅谷剛彦氏です.

銭の問題はどうにかなるにしても,教養については影響力が大とのこと.

教養深い母親の存在が,次代の礎となると言っても過言ではないのかもしれません.

※後日,基準値みたいな相関係数との比較をする方法
基準となる相関係数との差を検定する
を書きました.こちらもご参考ください.

そもそも,相関係数の有意性を算出したいという場合は,
エクセルで相関係数のp値を出す