χ2検定がいまいち、よく分からないというご指摘を受けました。
分かりやすく書きたいと思います。
このχ2(カイ二乗と読みます)検定は、既に分かっている事柄と、実際に起こった事柄の食い違いの度合いから、実際に起こった事柄が、めったにない稀な事柄なのか、そうではなくって普通の範囲に充分に入る事柄なのかを判定する手法です。
具体的に言うと、既に分かっている事柄というのは、「+4状の合成確率は60%ですと公式発表されている」を指します(60%を成功確率の期待値と呼びます)。
1. 5回合成したら、3回成功した(実際の成功確率60%、食い違い0ポイント)。
2. 5回合成したら、4回成功した(同じく80%、食い違い+20ポイント)。
3. 5回合成したら、悲しいことに1回しか成功しなかった(同じく20%、食い違い-40ポイント)。
三つのケースはいずれも、5回行った時の結果です。
1.の60%の成功率だった人は、公式発表の通りですから、きっと納得されるでしょうから特に問題はありません。
また、2.の100%の成功率だった人は、公式発表よりもどういう訳か20ポイントも高かったのですが、得をしているので問題視されにくいでしょう。
3.の人は、お気の毒なことに、公式発表よりも40ポイントも下回っていて、お怒りになる方もいるかもしれません。
まさしく、悲喜こもごもな結果になっています。
しかし、お待ち下さい。
これら3つのケースは、それぞれ、たった5回しか合成を行っていません(試行回数は5、または、n=5と言います)。
事例がたった5回では、検証するのに十分な数であると考えにくいと思いませんか? 仮に、第4のケースとして……
4. 5回合成したら、嬉しいことに全て成功した(同じく100%、食い違い+40ポイント)。
と、いった見事なケースでも、たった5回の出来事だからなぁ〜。と判断されてしまいかねません。
では、充分な数のケースだったらどうでしょうか? 例えば、合成回数と成功の数を2倍にしてみましょうか。
2−1. 10回合成したら、6回成功した(実際の成功確率60%、食い違い0ポイント)。
2−2. 10回合成したら、8回成功した(同じく80%、食い違い+20ポイント)。
2−3. 10回合成したら、悲しいことに2回しか成功しなかった(同じく20%、食い違い-40ポイント)。
2−4. 10回合成したら、嬉しいことに全て成功した(同じく100%、食い違い+40ポイント)。
さっきより、2倍も説得力が有る気がしませんか?
2−1.は、問題は全くなさそうです。
2−2.は、合成回数が10回ならまだ普通に起こりうる確率のような気がしないでもありませんが、得をしているのでやはり問題にならないでしょう。
2−3.は、5回の時よりも悲しさが倍増して、怒りもヒートアップしていそうです。
2−4.については、見事としか言い様がありません。
何となく、お分かりいただけたかと思いますが、実際の成功率が5回と10回と同じであっても、食い違いの度合いの説得力がかなり違います。
それも含めて数学的に証明しようってのが、χ2検定なんです。
つまり。
食い違いの度合いが、明らかに大きい時。何らかの意図的な力が加わっている。
と、考えられる検定であると、言い換えることができます。
公式発表の合成確率が60%と出ているにもかかわらず、実際に100回検証してみると、10回しか成功しなかった。または、90回も成功した。というのは、明らかに何らかの意図的な力が働いている気がします。
また、繰り返しになりますが、同じ確率で、10回中1回しか成功しなかった。または9回も成功した。というのとでは、何らかの意図が感じられる気はするけれど今ひとつ説得力が欠けている気がします。
100回のうちの10回だと多くの人から同情してもらえそうですが、10回のうち1回だと、ふーん運が悪かったね。と、さらっと言われそうな気がしてなりません。
結構、面白いなと思われた方は、こちらのページに、簡単に検定が出来るページを作っておいたので、遊んでみて下さい。
それでは、続きです。
χ2値一覧
発表確率 |
実際の確率 |
60% |
100% |
90% |
80% |
60% |
40% |
20% |
10% |
n=5 |
|
5勝0敗 |
- |
4勝1敗 |
3勝2敗 |
2勝3敗 |
1勝4敗 |
- |
χ2 = |
3.33 |
- |
0.83 |
0.00 |
0.83 |
3.33 |
- |
n=10 |
|
10勝0敗 |
9勝1敗 |
8勝2敗 |
6勝4敗 |
4勝6敗 |
2勝8敗 |
1勝9敗 |
χ2 = |
6.67 |
3.75 |
1.67 |
0.00 |
1.67 |
6.67 |
10.42 |
n=100 |
|
100勝0敗 |
90勝10敗 |
80勝20敗 |
60勝40敗 |
40勝60敗 |
20勝80敗 |
10勝90敗 |
χ2 = |
66.67 |
37.5 |
16.67 |
0.00 |
16.67 |
66.67 |
104.17 |
|
検定表
危険率 |
5% |
1% |
0.5% |
χ2 = |
3.84 |
6.63 |
7.88 |
■危険率について
通常の検定では、判定をする基準としては、
小さい確率とされている5%で検定をします。
これは、傾向を掴むための検定ですので、
5%の危険率でも充分だと思います。
|
それぞれのχ2の答え、つまり、食い違いの指数が出たところで、実際にどの程度食い違っているのかを検定していきましょうか。
検定というからには、その検定の内容の精度を断わっておかないといけません。
精度とは、どういうことかと言いますと、検定には、間違える可能性が残されている。ということです。
これは、一般的に危険率と呼ばれています。
危険率が5%と仮に言いますと、その検定は5%の確率で間違える可能性がある。ということになります。
危険率が低いほど、そのハードルが高くなっていくことになります。それを含めて、検定をしていきます。
まず、左の表(χ2値一覧)のn=5のχ2の数字をご覧下さい。左から、3.33、0.83、0.00、0.83、3.33と記載されています。
食い違いの指数ですので、全く食い違いがなければ0ということになります。
次に、右の表(検定表)の危険率のχ2の数字をご覧下さい。いずれも先の数字より大きいのが分かるかと思います。
つまり、n=5の5つの条件に関してのみ検定すれば、たとえ、5勝0敗でも1勝4敗でも、予想したとおり充分起こりうる事象であることが分かるのです。
続いて、n=10を見てみます。
10勝0敗の事象が起こったとき、その出来事は、右の表からも分かるように、危険率1%のハードルをクリアしています。
これは、間違える危険性が1%。早い話、100〜200回の内1回起こりうる確率であるとも言い換えることができる訳で、その出来事について、有意差がある。という言い方をします。
また、9勝1敗ですが、わずかに危険率5%のハードルを越えません。これは、充分によくある出来事として処理してしまってもいいでしょう。
逆に、1勝9敗は、予想を反して(?)、200回に1回発生しない出来事であることが分かりました。検定をすることで1勝9敗の人は、奈落のステージでスポットライトを浴びた様だ。と言っても誰も文句を言う人はいないでしょう。
おまけにつけた、n=100ですが、ここまで説明すれば、わざわざ書くまでもないですね。
ちなみに。
1月5日の+4状の食い違い度は、1.54でしたが、直近の1月23日の食い違い度は、いくらでしょうか?
もう、計算しちゃいましたか?w そうです、2.45に食い違い度が上がってます。
すなわち、オカルト現象は確実に発現してるって証拠(?)なのかもですな。+4マントに至っては、検証するまでもありません。