プログラミング講座(113) χ二乗検定

9路盤の初手天元並びの集計結果の分布が偶然のばらつきの範囲にあるのかどうかをχ2(カイ二乗)検定で調べてみることにします。

本来どういう分布になるのか理論的にはちょっと分からないので囲碁シミュレータで作った全8175局の結果を期待値としてみます。データがなかった区間は計算に支障があるので削除し、17区間でのχ2の値を計算します。実現値を xi、期待値を ei とすると、

χ2 = Σ((xi-ei)2/ei)

となり、これを Excel で計算したのが下図のセル M19 です。
図113 χ二乗検定 【図113 χ二乗検定】

この計算結果の確率分布がχ2分布に従うそうです。今回は17区間に分けたので17事象、すなわち自由度17-1=16のχ2分布の右側 5% に入った場合は、統計的に偶然とは言えないとします。χ2分布の右側 5% に入るχ2の値は、Excel の =CHIINV(0.05,16) で計算できます。この値が上図のセル M21 に入っています。

計算した値が 23.7 、有意水準(危険率) 5% に入る値が 26.3 以上となるので、結論としてこの初手天元並びの集計結果は偶然のばらつきの範囲に入っていると言えることが分かりました。つまり統計的には初手天元並びの分布がそれ以外の分布に比べて明らかに右より(勝率が高い)とは言えないということです。

この検定結果は区間を17に区切ったことの影響を受けているようにも見えます。区間の数を減らし(自由度を減らし)てどうなるか、試してみようと思います。

 

コメントを残す