ベルアイルの神が振るサイコロは本当にランダムか?
ちょっと前に、ベルアイルのランダムは偏りすぎ、などと暴言を吐いてしまいました。
で、本当のところどうなんだろうということで、もうちょっと考えてみました。
もともとは、成功率92%のアイテム作成で3回連続失敗が出た、ということを問題にしたわけですが、今回は成功率92%のアイテムを23回作成して、5回失敗(成功率78.3%)した部分を問題にします。
アイテム作成が成功するか失敗するかは、2項分布に従います。
2項分布の期待値(=成功する回数)はnp、分散はnp(1 - p)です。
標本の大きさに左右されるのがうまくない場合は、試行回数nで割った値で評価します。
この場合は、期待値はp、分散はp(1 - p)となります。
さて、今回と同程度以上に悪い結果が発生する確率というのはどのぐらいなんでしょう。
検証するのは、pが0.92、nが23のときですね。
この場合の期待値は23×0.92で21.16、標準偏差は、23×0.92×0.08の平方根ですから約1.3です。
従って、95%の確率で21.16±2.6回成功します。
そして、99%の確率で21.16±3.9回成功します。
ということは、23-5=18回成功しているので、21.16-18=3.16、つまり99%まで範囲を広げればちゃんと入っているということになります。
で、3.16÷1.3=2.43で、信頼度98.5%となります。
逆に言えば、1.5%ぐらいは今回と同程度以上に悪い数字が出る、ということでしょうか。
このぐらいの数字なら、まぁ運が悪かった、で済まされる範囲なのでしょうね(;_;)
別の見方。
(n - l)p / ((l + 1)(1 - p))を計算します。
lは18、nは23、pは0.92なので、5×0.92÷19÷0.08で約3.03となります。
F0.025 (2(l + 1), 2(n - l))は、表が見あたらないのでExcelのそれらしい関数で計算した結果約3.26と出ました。
この結果、仮説「このアイテムを作成したとき、成功する確率は92%である」は棄却されます。
・・・あれ、仮説が棄却されちゃいましたね・・・
どっちなんだw
ま、結局23回では少なすぎるということでしょうか。
それと、よくわかっていないで検討してるから、大間違いをやらかしているか・・・
ついでに・・・
信頼限界の式から許容範囲がd = zα/2 σ / √nとなるので、これを変形して
n = zα/22 σ2 / d2
これは、許容範囲を(1 - α)の確率でd以内とするための標本の大きさを求める式になります。
危険率1%、許容範囲を10%とすれば、
n=z0.0052×0.92×0.08/0.12=2.5762×0.0736/0.01=約50。
50回作成すれば、92±10%以内の範囲で成功する確率が99%となります。
でも、やっぱり1%はこの範囲から外れちゃうんですよねw
同じ条件でn=23の時のdを求めると、約14.6%となります。
78.3+14.6=92.9なので、どうやら範囲内ですね。
つまり、成功率92%のアイテムを23回作成したとき、実際に成功する確率が92±14.6%の範囲内に信頼度99%で収まる、と。
最初の結論とだいたい同じような感じっぽいですね。
(もしかすると、母集団の大きさが有限の場合は、許容範囲は母集団の大きさに対する割合にしなければならないのかもしれません。)
まぁ、母集団のパラメータがわかってるのだから、確認としては最初のだけで十分でした・・・
この結論が今回の考察の最大の成果、かもしれないw
で、本当のところどうなんだろうということで、もうちょっと考えてみました。
もともとは、成功率92%のアイテム作成で3回連続失敗が出た、ということを問題にしたわけですが、今回は成功率92%のアイテムを23回作成して、5回失敗(成功率78.3%)した部分を問題にします。
アイテム作成が成功するか失敗するかは、2項分布に従います。
2項分布の期待値(=成功する回数)はnp、分散はnp(1 - p)です。
標本の大きさに左右されるのがうまくない場合は、試行回数nで割った値で評価します。
この場合は、期待値はp、分散はp(1 - p)となります。
さて、今回と同程度以上に悪い結果が発生する確率というのはどのぐらいなんでしょう。
検証するのは、pが0.92、nが23のときですね。
この場合の期待値は23×0.92で21.16、標準偏差は、23×0.92×0.08の平方根ですから約1.3です。
従って、95%の確率で21.16±2.6回成功します。
そして、99%の確率で21.16±3.9回成功します。
ということは、23-5=18回成功しているので、21.16-18=3.16、つまり99%まで範囲を広げればちゃんと入っているということになります。
で、3.16÷1.3=2.43で、信頼度98.5%となります。
逆に言えば、1.5%ぐらいは今回と同程度以上に悪い数字が出る、ということでしょうか。
このぐらいの数字なら、まぁ運が悪かった、で済まされる範囲なのでしょうね(;_;)
別の見方。
(n - l)p / ((l + 1)(1 - p))を計算します。
lは18、nは23、pは0.92なので、5×0.92÷19÷0.08で約3.03となります。
F0.025 (2(l + 1), 2(n - l))は、表が見あたらないのでExcelのそれらしい関数で計算した結果約3.26と出ました。
この結果、仮説「このアイテムを作成したとき、成功する確率は92%である」は棄却されます。
・・・あれ、仮説が棄却されちゃいましたね・・・
どっちなんだw
ま、結局23回では少なすぎるということでしょうか。
それと、よくわかっていないで検討してるから、大間違いをやらかしているか・・・
ついでに・・・
信頼限界の式から許容範囲がd = zα/2 σ / √nとなるので、これを変形して
n = zα/22 σ2 / d2
これは、許容範囲を(1 - α)の確率でd以内とするための標本の大きさを求める式になります。
危険率1%、許容範囲を10%とすれば、
n=z0.0052×0.92×0.08/0.12=2.5762×0.0736/0.01=約50。
50回作成すれば、92±10%以内の範囲で成功する確率が99%となります。
でも、やっぱり1%はこの範囲から外れちゃうんですよねw
同じ条件でn=23の時のdを求めると、約14.6%となります。
78.3+14.6=92.9なので、どうやら範囲内ですね。
つまり、成功率92%のアイテムを23回作成したとき、実際に成功する確率が92±14.6%の範囲内に信頼度99%で収まる、と。
最初の結論とだいたい同じような感じっぽいですね。
(もしかすると、母集団の大きさが有限の場合は、許容範囲は母集団の大きさに対する割合にしなければならないのかもしれません。)
まぁ、母集団のパラメータがわかってるのだから、確認としては最初のだけで十分でした・・・
この結論が今回の考察の最大の成果、かもしれないw
※このブログはトラックバック承認制を適用しています。ブログの持ち主が承認するまでトラックバックは表示されません。
おひさです。やっぱりむづい・・・
某オンゲーのくじで、100回以上引いても出なかった1等というのを30回ほどで2回ゲットした私は強運だったのでしょうか。
ランダムの確立ってやつの わな だと思っていたのですが・・・。
某オンゲーのくじで、100回以上引いても出なかった1等というのを30回ほどで2回ゲットした私は強運だったのでしょうか。
ランダムの確立ってやつの わな だと思っていたのですが・・・。
おひさしぶりです^^
んむ、それはなかなかの強運ですね、うらやましいです。
たまにはそういうこともないとねぇw
んむ、それはなかなかの強運ですね、うらやましいです。
たまにはそういうこともないとねぇw

