Probability

同班五個孩子同名的概率

  • August 3, 2016

在嬰兒命名論壇上,準父母一直在重複他們對詹妮弗的恐懼:“我不希望我的孩子成為班上 5 個以他的名字命名的孩子之一。” 問題是,再也沒有一個名字能比得上那種受歡迎程度了,即使在詹妮弗熱潮的高峰期,你也沒有在一個班級裡得到五個。我想為這些父母提供某種答案,即這種重複名字的巧合是多麼不可能。

使用社會保障局廣泛的嬰兒姓名數據(https://www.ssa.gov/oact/babynames/limits.html),有人能告訴我如何計算美國小學班級有五個孩子的機會嗎?同名的孩子?(為簡單起見,“同名”是指相同的拼寫,“學校班級”是指所有孩子都在同一年出生。)我沒有指定班級人數,但絕對應該大於 4 . :-)

所有數據都可以在這裡找到。表中的每個值表示給定來自該位置和出生年份的 25 人樣本的概率,其中 5 人將共享一個名字。

方法:我在每個名字上使用二項式 PDF來計算任何給定的 25 人班級有 5 個人同名的概率:

n = class size
k = 5,6,...,n 
p_i = (# of name[i]'s) / (total # of kids)

例如,如果總共有 4,000,000 個孩子和 21,393 個 Emily,那麼在 25 名學生的任何給定班級中有 5 個 Emily 的概率是 Binomial(25, 5, 0.0053) = 0.0000002。對所有名字求和並不能給出確切的答案,因為根據包含/排除原則,我們還必須考慮到多組 5 人共享名字的可能性。然而,由於這些概率對於所有實際目的幾乎為零,我假設它們可以忽略不計,因此.

**更新:**正如許多人指出的那樣,隨著時間的推移和州之間存在相當大的差異。所以我運行相同的程序,逐個州,隨著時間的推移。以下是結果(全國概率為紅色,個別州為黑色):

在此處輸入圖像描述

有趣的是,過去幾十年來,佛蒙特州(我的家鄉)一直是最有可能發生這種情況的地方之一。

引用自:https://stats.stackexchange.com/questions/227139

comments powered by Disqus