第11回 ナンバーズ3 300回のデータ分析 その2

今回は、前回の基本データを基に、仮説検定で高額配当狙いの分析をします。
10月中の約束を守れず、申し訳ありませんでした。

1.検定とは

仮説検定とは、仮説を立て、あらかじめ決めておいた基準に基づいて仮説の真偽を判定する方法です。
特に今回のように、確率的な出来事による結果をいくつかのグループに分けて、その出現頻度に傾向があるか否かを判定するには、「分割表による独立性の検定」がよく使われます。この講座でも第2回などで使いました。
これは、

  1. 傾向は無いと仮定する(仮説を立てる)。
  2. 検定のための計算を行う。
  3. 2により、データの偏りが単なる偶然で起こる確率を得る。
  4. 3の確率が基準以下であれば仮説を棄却(否定)する。

という流れで行います。「基準が0.5%」ならば、3の結果が0.5%以下であれば「仮説を棄却(否定)」するということです。
よって、「基準」はあらかじめ決めておくことが前提となりますが、今回は3までで止めておいて、判定はみなさんそれぞれにお任せします。
例えば、3で得た確率が0.1%以下と出たら、あなたはどう思いますか? 1000回に1回も起こらないとしたら、偶然ではなくそこには何か理由があると考えた方が良いと思いませんか?

2.高配当出目の検定

A 日付不可&重数(ストレート)
これは、第4回で検証したものをさらに絞り込んだものです。
例えば第4回では「449」は日付不可&重数としましたが、平成4年4月9日と読めるので、今回は入れません。(第4回では「平成年」を考慮していませんでした)
結果、000〜999の数字千個のウチ、このグループに入る数字は、

010,020,..,090(9個)
011,022,..,099(9個)
100,200,..,900(9個)
440,550,..,990(6個)
001,002,..,009,000(10個)

の合計43個(4.3%)です。早速分割表を見てみましょう。

日付不可&重数(ストレート)の全抽選結果はこちら

日付不可
&重数
その他日付不可
&重数率
平均賞金を上回るグループ1161257.2%
平均賞金を下回るグループ1741750.6%
102903003.3%
平均賞金¥148,160¥98,955¥100,595

理論出現率4.3%に対して、3.3%と低く感じますが、あと2〜3回出ていれば理論値に到達しますので、気にするほどではないでしょう。1000通りの出目に対して300回の試行ではまだまだ少ないのです。
検定の手順は、

  1. 統計量Yを求める。
  2. カイ自乗分布表からYに対応する確率を求める。

となります。このカイ自乗分布表は、次のようになっています。

確率
0.4549 50%
1.323 25%
2.706 10%
3.841 5%
5.024 2.5%
6.635 1%
7.879 0.5%
10.82 0.1%

統計量Yが大きいほど、それが起こる確率が低いということです。

では、統計量Yを計算しましょう。
計算方法を説明するため、分割表をもう一度簡単に書きます。

日付不可&重数その他
平均賞金を上回るグループX11X12X1.
平均賞金を下回るグループX21X22X2.
X.1X.2n

この表中の記号に合わせて、次のように計算します。

統計量Y=Σ(i=1,2)Σ(j=1,2)((Xij-1/n×Xi.×X.j)2/((1/n)×Xi.×X.j)
=(9-1/300×125×10)2/((1/300)×125×10)
+(116-1/300×125×290)2/((1/300)×125×290)
+(1-1/300×175×10)2/((1/300)×175×10)
+(174-1/300×175×290)2/((1/300)×175×290)
≒9.943

表から、確率は「0.1%以上0.5%以下」とわかります。
つまり、この傾向(日付不可&重数は配当が高い)は単に偶然起きたとするなら、その確率は1000回に5回以下ということです。
ちなみに0.5%の確率というのは、硬貨を投げて表か裏かを当てるゲームで7〜8回続けて勝つ確率です。
(0.57=0.78%、0.58=0.39%)
どれだけ起こり得ないか試してみて下さい。

B 日付不可(ミニ)
これは、第2回で検証したものと同じです。
ミニは、本来あるべき百位の数字を無視するわけですが、百位に何が来ても日付不可となるのは以下の7個だけです。(理論出現率7%)

00 40 50 60 70 80 90

数字をクリックすると第1回から最新回までの当該数字の抽選結果が見られます。

分割表を見てみましょう。

日付不可その他日付不可率
平均賞金を上回るグループ2010412416.1%
平均賞金を下回るグループ1741761.1%
222783007.3%
平均賞金¥13,309¥9,753¥10,013

理論出現率7%に対して、7.3%。100通りの出目に対して300回ならまあまあですね。
では、統計量Yを計算しましょう。
計算方法は上と同様です。

統計量Y=Σ(i=1,2)Σ(j=1,2)((Xij-1/n×Xi.×X.j)2/((1/n)×Xi.×X.j)
=(20-1/300×124×22)2/((1/300)×124×22)
+(104-1/300×124×278)2/((1/300)×124×278)
+(2-1/300×176×22)2/((1/300)×176×22)
+(174-1/300×176×278)2/((1/300)×176×278) ≒24.063

私の持っている表には、確率0.1%以下の部分がありません(T_T)。かなり低い確率になることは明白ですが、一応「0.1%以下」としましょうか。(どなたか、自由度1のカイ自乗分布の自力計算方法を教えて下さい)
この傾向(00、40、50、60、70、80、90は配当が高い)は単に偶然起きたとするなら、その確率は1000回に1回以下ということです。

C 百位0(ストレート)
これは、新しいグループです。
前回の分析で、桁別の出現頻度を見ましたが、百位が0のときの平均配当が高いので、検証することにしました。
分割表は次の通りです。

百位0(ストレート)の全抽選結果はこちら

百位0その他百位0率
平均賞金を上回るグループ1910612515.2%
平均賞金を下回るグループ1671754.6%
272733009.0%
平均賞金¥119,504¥98,725¥100,595

理論出現率10%に対して、9.0%。まあまあですね。
では、統計量Yを計算しましょう。

統計量Y=Σ(i=1,2)Σ(j=1,2)((Xij-1/n×Xi.×X.j)2/((1/n)×Xi.×X.j)
=(19-1/300×125×27)2/((1/300)×125×27)
+(106-1/300×125×273)2/((1/300)×125×273)
+(8-1/300×175×27)2/((1/300)×175×27)
+(167-1/300×175×273)2/((1/300)×175×273)
≒10.058

表から、確率は「0.1%以上0.5%以下」となりますが、ほぼ0.1%に近いので、「0.2%以下」としてもいいでしょう。
つまり、この傾向(百位0は配当が高い)は単に偶然起きたとするなら、その確率は1000回に2回程度ということです。 この桁別頻度の偏りは、他にも見られます。前回の表を見ていただければ一目瞭然ですが、高配当は、「十位7」「一位0」、低配当は「百位2」「十位1」「十位2」などがあります。これらもいつか検証したいと思います。

D 複数出現出目は低配当?(ストレート)
これも、新しいグループです。
前回の分析で、ストレートの数字別の出現頻度を見ましたが、どうも2回以上出ている目の2回目以降は配当が低いようです。

で、計50件の2度目以降がありました。
ちなみに、出現回毎に平均配当を調べると、

1回目2回目3回目
3回出た目¥106,720¥88,020¥83,060
2回出た目¥105,282¥92,190

と、徐々に平均配当が下がっています。
「一度出た目は人気薄だろう」と思っている人が多い? 分割表は次の通りです。

2度目以降その他2度目以降率
平均賞金を上回るグループ1511012512.0%
平均賞金を下回るグループ3514017520.0%
5025030016.7%
平均賞金¥90,860¥102,542¥100,595

では、統計量Yを計算しましょう。

統計量Y=Σ(i=1,2)Σ(j=1,2)((Xij-1/n×Xi.×X.j)2/((1/n)×Xi.×X.j)
=(15-1/300×125×50)2/((1/300)×125×50)
+(110-1/300×125×250)2/((1/300)×125×250)
+(35-1/300×175×50)2/((1/300)×175×50)
+(140-1/300×175×250)2/((1/300)×175×250)
≒3.36

表から、確率は「5%以上10%以下」となります。
この傾向(2度目以降は配当が低い)は単に偶然起きたとするなら、その確率は100回に5〜10回程度ということです。

これはあまり傾向があるとは言えそうもありませんね。先の硬貨投げのゲームでいえば、4連勝(6.25%)ぐらいの確率です。たまにはそういうこともあるでしょう
見た目には低配当傾向が見えるのに何故でしょう? 前回の分析で見ましたが、ストレートの配当は開始当初に比べて全体的に下がっています。そうです低配当傾向にあるのは何もこのグループに限ったことではないのです。

3.狙い目

さて、いくつかの傾向について検証してきました。皆さんはどう思われたでしょうか? 「日付不可&重数」で「百位0」で「300回の抽選で一度も出ていない目」というと、

010、020、030、040、050、060、070、080、090、
011、033、044、055、099、001、002、005、006、
007、008、009、000

の22点です。このウチ「001」は第302回で出て¥103,100でした。平均よりは上ですが、あまり高配当とは言えないですね。これは、「777」が超低配当(第309回 ¥57,100)だったのと同じ様なことだと思います。あまりにも特殊な数字ということでしょうか。
そこで私のお勧めは、桁別平均配当から、

008040050060070080090

数字をクリックすると第1回から最新回までの当該数字の抽選結果が見られます。

です。ただし、これは出目予想ではありませんのでご注意を。

まだ分析したいことがいくつかあります。 例えばナンバーズの抽選は、数字の書かれた回転する円盤に矢を射る方法を採っています。そこで隣り合う数字同士で何か傾向があるのでは? これはデータの分析からしなければなりません。
また、「前回の数字の種類(3つ同じ、2つ同じ、全て異なる)による配当の違いに傾向があると言えるか?」と、データを添えてメールをくださった方がいらっしゃるので、その件についても調べたいと思っています。
他にも分析依頼大募集中です!(ただし、期限無しに限る...)

次回は何をしよう...ネタがない...またナンバーズか...
ネタも大募集中! よろしくお願いします。

1997.11.14 DEM.
Sponsored Link - Books

デザインの骨格 デザインの骨格
なるほど、デザインってそういうことだったのか…アップルの製品が美しいのには理由がありました。ジョブズの亡き後もその精神が受け継がれていきますように。

スティーブ・ジョブズ I スティーブ・ジョブズ I

論理思考力トレーニング法 ―気がつかなかった数字の罠 論理思考力トレーニング法
――気がつかなかった数字の罠

世に溢れる統計や確率の話は注意して見ないといけない。そういう事を思い知らせてくれる本です。「モンティ・ホール・ジレンマ」の火元でもある著者。これについてもたっぷり解説されています。

複雑な世界、単純な法則 複雑な世界、単純な法則
共通の設計者などいないはずの様々なネットワーク(複雑な世界)がほぼ同じ構造(単純な法則)をしていることに驚かされます。Facebook によって改めて注目された「6次の隔たり」しかないスモール・ワールドとは !?

世にも美しい数学入門 世にも美しい数学入門
「博士の愛した数式」の小川洋子さんと、数学者でお茶の水女子大教授の藤原正彦氏との対談です。

宇宙は何でできているのか 宇宙は何でできているのか
宇宙全体の物質のうち、私たちが知っている原子からなるものは、たったの4%でしかない。残る96%は未知の物質――暗黒エネルギーと暗黒物質――最新の宇宙論が「私たちはなぜ存在するのか」などに挑む。

フォントのふしぎ ブランドのロゴはなぜ高そうに見えるのか? フォントのふしぎ――ブランドのロゴはなぜ高そうに見えるのか?
商売柄こういう本は大好きですが、これはぜひどなたにでも読んでいただきたい。美しいものはなぜ美しく見えるのか…そんなことが見えてきそうです。

イニシエーション・ラブ イニシエーション・ラブ
最期から2行目を読むとそれまで読んできた物語が全く別のお話に変貌します。賛否ある本ですが私は驚愕しました。

直観でわかる数学 直観でわかる数学

そんなバカな!〜遺伝子と神について (文春文庫) そんなバカな!〜遺伝子と神について
我々は遺伝子の乗り物(ヴィークル)に過ぎないのか?生存・繁殖に有利な遺伝子が多くのヴィークルに乗っている。 利己的に振る舞う遺伝子によって行動させられるヒトや動物。これこそが「進化」の本質。目から鱗、間違いなし!

先頭に戻る