投稿

8月, 2011の投稿を表示しています

注目の投稿

あまり知られていないt検定|1サンプルのt検定

イメージ
1サンプルのt検定のやり方 あんまり(少なくとも私たちの分野では)知られていないt検定を取り上げます. めっちゃ基礎的な統計学の本とか,研究方法を取り扱ったテキストなんかでは掲載されているのですが,私自身知らなかったこともあってあまり使ったこともありません.   一般的には 「1サンプルのt検定」 と呼ばれ,標本集団の平均値と母集団の平均値とを比較するt検定です. SPSSにも装備されていて,ここでは「1サンプルのT検定」 という名称がついています. for Windows Ver 11.0では以下のような表示です. t検定といえば繰り返しのあるデータ同士の比較 (いわゆるあのt検定) だけだと思っていたのですが. いつの頃だったか,友人から, 「今回の実験で測定した値が,標準値と比べて有意な差があるかどうかを検定する方法ってわかる?」 って聞かれて初めて, 「そういえば知らないなぁ.でも,あったら利用価値は高いよなぁ」 と思いながら調べた記憶があります. この検定は簡単な研究報告とか卒論レベルでの利用価値が高いかと思います. これからの季節は学生たちの無計画な卒業研究と実験や調査が始まる時期です. 適当な友達を集めてとりあえず何か測定したんだけど,その測定値が何を意味するのか分かんないので指導教員に聞いてみたら 「自分で考えろ」 と突っぱねられたので,仕方なく私のところに来た.というパターンが考えられます. 無計画な実験なので対照群とかを用意していることもなく,今から測定しろよと指示すると 「就活があるから...」 などと言って逃げまわるので,とりあえずそこにあるデータをいじるしかないオチです. しょうがないので 「全国標準値と比べてみるか」 なんて状況になるんですね. まぁ,測定したデータをパッと見て,印象だけで 「高い/低い」 「優れている/劣っている」 と結論づけちゃうよりは, 「データは統計学的な手順を踏んで有意性が認められないと,断定的な物言いはできないよ」 ということをわかってもらうだけでも十分だと思うんです. 研究活動というものに特段興味を示す学生以外にとっては,きっちりとした実験とか調査をやらせるだけ骨折り損のくたびれ儲けです. 卒論という活動を通じて,

相関係数の差を検定したいとき(エクセルでできる方法)

イメージ
下の図をご覧ください. AとBどちらの図の相関係数が高いと思いますか? 当たり前ですが,Aの方です. 相関係数はそれぞれ, Aは「 0.791 」 Bは「 0.423 」 です. ※いずれも四捨五入している. よくある統計分析中の苦労話として, t検定や分散分析などで平均値の比較をやったんだけど,なかなか有意性が見られない.ってんで,それでもなんとか実験結果に統計学的な有意差が欲しいから行き着いたのが 「相関係数に差があるか?」 というものです. 卒論のデータを分析している多くの学生,あと院生もたまにこの 「相関係数の差を検定できないか?」 を聞いてきます.   例えば,給料の額と幸福感の相関関係を調べたとしましょう. 例に出したAの方は女性グループ,Bは男性グループだとします. 男女別に給料と幸福感の間に「相関関係があるのか?」を分析したら,上記のような相関係数がでました. どちらもN数(調査対象者数)は26名でした. そんなわけで,前回の記事で紹介したように相関係数の有意性を求めたら,どちらも有意な相関があると認められることになります. N数が26の場合は0.388以上の相関係数があれば有意だからです. ということは,“男女ともに給料と幸福感の間には有意な相関がある” ということになっちゃって,結果が面白くなくなってしまいます. それに,Bの男性は有意とはいえ,散布図としてみるとAの女性よりも相関関係が弱いように見えるじゃないですか. ここで引き下がるのは悔しいものです. こんなとき,相関係数の差の検定をやってみましょう. 以下の記事を読んでも不安がある場合や,元の作業ファイルで確認したい場合は, このリンク先→「 統計記事のエクセルのファイル 」から, 「相関係数の差を検定」 のエクセルファイルをダウンロードしてご確認ください. 2011年現在,相関係数の差の検定ができる統計ソフトは見当たりません.ちゃんと探せばあるのかもしれませんが,詳しく確認していません. でも,そんなに難しい操作はせずともExcelで計算できますので,それを紹介します. ※ここで紹介しているのは,対応のないデータ同士による相関係数の差の検定方法です. 後日,対応のあるデータに

エクセルExcelでの簡単統計(相関関係)

イメージ
今回はひたすらExcelだけを使った 相関関係 についての統計処理です. 相関関係がどんなものか,簡単に説明しときます. よく下の画像のような図を持ちだしてきて, “xが大きくなればなるほど,yも大きくなる” というような表現がされます. 1.解釈が簡単 2.視覚的にも訴えかけ易い 3.おまけにそのグラフを作る作業も楽 と三拍子そろっており,素人を騙すうえでも非常に強力なツールです. 研究やなんかでも多用される統計手法の一つで,とにかく解釈が簡単なうえに “いかようにも言い逃れできる” ところから, 私としては最強の統計手法と位置づけています. 後日,その「最強の統計手法」を使って,最凶の卒論・修論作成法を解説しました. ■ アンケートだけで卒論・修論を乗り切るためのエクセル相関関係 悪用しないようにご活用ください. 実際,適当な研究報告書とか説明資料をつくる時には重宝します.しかも相関関係を表す図は大きくなりやすいことから,ページ数を稼ぐ力もありますのでまさに言うこと無しですね. マジメな話,それだけに解釈の仕方には十分に気を付けなければならない統計手法です. ・二酸化炭素が増加すると気温が高くなる ・警察官が多い都市ほど犯罪が多い ・お小遣いが多いお父さんほど給料が高い なんていう統計おもしろネタは多いものです. ※これらは全て逆から読んだほうが正しい解釈の可能性が高い でも,これらを本気で信じちゃう人もいるので注意しなきゃいけないのです. 前置きはこれぐらいで,さっそくExcelの操作方法です. 下に示した図のようなデータが典型的な例でしょうか. では相関関係を示す統計処理として有名な ピアソンの積率相関係数 というのを出しましょう. G列2行目のセルに以下の関数を入力し,データAとデータBの相関関係を求めます. =PEARSON(B2:B27,C2:C27) 以上,基本的にはこれで相関係数の算出は終了です. このあと,このままセルをオートフィルで右方向にひっぱって自動的に算出してもいいのですが. 私は以下の図のように,どことどこを参照しているのかタイトルを付けておいて,$マークを使って参照元を固定