2012年2月23日木曜日

エクセルExcelでΧ二乗検定を part2

前回の■エクセルExcelでΧ二乗検定をの続きです.

今回は「期待度数(期待値)」の部分を少しいじった分析方法を紹介します.

ところで,
大学の入学試験において学科によっては「実技試験」が課されることがあります.スポーツとか音楽とかデッサンなどが主なものでしょうか.

実は,実技試験の点数のつけ方は(きっとどこの大学も)結構しっかりしていて,受験者数が少数であったとしても,配点の分布は「正規分布」させるように指示があります.

「正規分布させる」,というのは,上の図のようなベルカーブを描いた度数に受験者人数を分布させるということです.
まあ,実際にはベルカーブを描いたように末広がりには行きませんが,人数をそれに近しいようにさせます.

例えば,100点満点中で採点するのであれば,
100~80点を1割
79~50点を4割
49点~20点を4割
19~0点を1割
といった人数(度数)になるよう受験者を振り分けながら採点します.
なぜなら,こうしておかないと大学・教員の裁量ひとつで偏りのある学生募集につながることになってしまうからです.

例をあげると,ある先生がスポーツ実技試験の中でも 「サッカー部にとって欲しい学生がたくさん受験していた」 という理由で,サッカーの実技を希望した受験生全員を100点にしてしまう,という事態が起きてしまうかもしれません.
これでは公平な入学試験とは言えません.

そうならないように,例え受験生全員が甲乙つけ難いスーパー・アスリートであっても,機械的に正規分布させるような採点を行ないます.

一昔前ならわかりませんが,最近はこのようにして採点します.
高校の先生や保護者によっては,「先生の力で,うちの子の点数をちょっと・・・」などと頼む人もいますが,残念なことに現在ではそれはできません.
最近の大学はスキャンダルに怯えていますので,外部の目もさることながら,内部の目がしっかりと光っています.


今回紹介するΧ二乗検定は,こうした“あらかじめ決められた”度数分布から逸脱していないかどうか?といったようなことを検定するケースです.

以下のように,受験者をA~Fの6段階で採点し,分布を5%,15%,30%,30%,15%,5%になるよう仕組んだという場合です.

期待値は受験者数140名をそれぞれ各ランクの分布における5%~30%にした場合の値を入力します.

実測値は,実際に採点して振り分けた度数です.
ご覧のように,A側に少し偏ってるのかなぁ..という申し訳ない感じの意図が見え隠れする採点になっております.

この採点が当初決めていた度数(人数)分布に近しく分布しているかどうか?
それをΧ二乗検定しました.
前回も紹介したように,ExcelにはΧ二乗検定によるp値を出してくれる関数があります.
図のように,B8のセルに以下のように入力します.

=CHITEST(B4:G4,B5:G5)

これで確定すると,

p値が0.05以上ということで,ギリギリですが当初決めておいた度数(人数)分布に沿う採点であることがわかりました.


とは言え,実際の入試などの採点では,分布が統計学的に有意かどうか?といったことを考えるよりも,期待値の通りの人数に割り振られているかどうかで判断する場合もあります.
そうしたほうが間違いがないからです.

どうしても1人2人といった人数をいじりたい場合は,入試部長や入試担当の人との相談とか,そういうことが多いですかね.


※その後,もう少し複雑な分析(残差分析とか)を解説した,
エクセルExcelでΧ二乗検定を part3
も書きました.

※後日,こんな怪しいブログよりも信頼性が高いものに触れてもらうよう,
独学で統計処理作業をスキルアップさせるための本
という記事を書きました.参照してください.

その中でも,以下の2冊はχ二乗検定やアンケート調査方法を学ぶ上でオススメです.

 


以下も参考文献としてどうぞ.