今朝、Evernoteを遡っていたら面白そうなネタがあったので記事を書いてみます。記事タイトルにあるように、“ある集団で誕生日がかぶる確率”ってどのくらいだと思いますか?例えば、学校で1クラスに40人いたとしましょう。一年は閏年を除いて365日ありますので、当然誕生日も365通りあるわけで、直感的には40人ぽっちではかぶらない確率の方が高いと感じるのではないでしょうか?しかし、確率を計算すると正解はなんと89.1%にもなります。つまり、40人いたらおよそ90%の確率で1組は誕生日が同じになるということです。なんだか信じられませんね。
誕生日のパラドックス
後ほど計算方法は説明しますが、大多数の方はまさかそんなに確率が高いわけないだろうと思ったことと思います。このように、直感的な予想と反した結果(パラドックス)であることから、これは”誕生日のパラドックス(Birthday Paradox)”と呼ばれています。この理論の元をたどると、”ある湖にいる魚の数を求めるにはどうすればいいか?”というテーマで執筆された論文があるようです。参考にその論文をのせておくので興味があればどうぞ。
参考:Schnabel, Zoe Emily. 1938. The estimation of total fish population of a lake. The American Mathematical Monthly. Vol. 45, No. 6 (Jun. – Jul., 1938), pp. 348-352
余事象
数学の授業で”余事象”について習った記憶はあるでしょうか?ある事象が起こる確率を求めるときに、その事象が起こらない場合を考えてアプローチする方法です。
例えば、10本のくじの中に当たりくじが2本あるとしましょう。この中から同時に3本を引くとき、少なくとも1本が当たる確率を求めたい時、余事象は3本ともハズレを引く場合になります。よって、この確率を余事象を用いて求めると次のようになります。
(全事象) - (余事象) = 1 - 8/10 × 7/9 × 6/8 = 7/15
この考え方を使えば、”ある集団で誕生日がかぶる”確率は、”ある集団で誕生日がかぶらない”という余事象を考えることでと求められます。細かい計算は省きますが、Excelでざっと計算してみたところ、1〜40人では次のようになります。計算結果を見ると、23人いれば確率が50%を超えるようで、にわかには信じがたいですが理論上はこのようになります。
人数 | 確率 |
1 | 0.0% |
2 | 0.3% |
3 | 0.8% |
4 | 1.6% |
5 | 2.7% |
6 | 4.0% |
7 | 5.6% |
8 | 7.4% |
9 | 9.5% |
10 | 11.7% |
11 | 14.1% |
12 | 16.7% |
13 | 19.4% |
14 | 22.3% |
15 | 25.3% |
16 | 28.4% |
17 | 31.5% |
18 | 34.7% |
19 | 37.9% |
20 | 41.1% |
21 | 44.4% |
22 | 47.6% |
23 | 50.7% |
24 | 53.8% |
25 | 56.9% |
26 | 59.8% |
27 | 62.7% |
28 | 65.4% |
29 | 68.1% |
30 | 70.6% |
31 | 73.0% |
32 | 75.3% |
33 | 77.5% |
34 | 79.5% |
35 | 81.4% |
36 | 83.2% |
37 | 84.9% |
38 | 86.4% |
39 | 87.8% |
40 | 89.1% |