Population

男女棋手 - 分佈尾部的預期差異

  • January 14, 2015

我對 2009 年這篇論文的發現感興趣:

為什麼(最好的)女性在國際象棋上如此出色?知識領域的參與率和性別差異

本文試圖解釋為什麼最優秀的男性棋手似乎比最優秀的女性棋手好得多(女性僅佔世界上最好的 1000 名棋手的 2%)。具體來說,他們聲稱最好的男性棋手和最好的女性棋手之間的巨大差異完全可以用兩個事實來解釋:

  • 男性棋手是女性棋手的 15 倍
  • 我們預計該比率在分佈的極端情況下會加劇,完全出於統計原因。引用論文:

即使兩組具有相同的平均值(mean)和變異性(sd),表現最好的個體更有可能來自更大的群體。兩組之間的規模差異越大,兩組中表現最好的人之間的預期差異就越大

然後再次,

這項研究表明,男性和女性國際象棋選手的頂級表現的巨大差異在很大程度上可以歸因於一個簡單的統計事實——在更大的人群中發現了更多的極端值。

因此,根據作者的說法,如果只有 6% 的國際象棋棋手是女性,那麼我們預計前 1000 名中只有 2% 的棋手,因此不需要關於生物學差異或社會偏見的其他解釋。

我的問題

我無法理解人口規模的微小差異在分佈的極端情況下會加劇的想法。特別是,這個反例有什麼問題:

大約每 12 名國際象棋選手中就有 1 名出生在 1 月份。所以他們只佔所有棋手的一小部分。通過這些統計方法,我們預計他們在最高級別的代表人數尤其不足——也許只有三分之一的頂級球員會在一月份出生。但是當然你可以將同樣的邏輯應用到每個月,你最終會得出一個荒謬的結論。

在我看來,如果你將一個人口分成兩組,你會期望在規模的各個方面都有相同的表演者比例。

由於我與已發表論文的結果相矛盾,我想我必須問 - 我做錯了什麼?

我認為你誤讀了這篇論文,他們沒有聲稱你所說的。他們的說法不是基於頂級球員的數量,而是基於他們的收視率。如果男性和女性的力量統計分佈相同,那麼如果她們佔總人口的比例為 6%,則前 100 名中女性的預期人數為 6。論文中的一些引用:

從國際象棋到科學等智力要求高的活動中,少數女性處於最高水平,一種流行的解釋是男性和女性智力能力的生物學差異。另一種解釋是,大樣本中的極值可能大於小樣本中的極值。

確實如此。你會期望最好的男人的評級高於最好的女人的評級。這篇論文繼續嘗試計算多少,這個結果在很大程度上取決於假設的分佈。

在第 3 部分,結果中,他們繼續將最好的男人與最好的女人配對,下一個最好的也一樣,依此類推,對於前 100 個這樣的配對。然後他們計算評分差異,並將其與預期評分差異進行比較,因為男性玩家多於女性玩家。所有這些似乎都是正確的,並且與您呈現它的方式非常不同。很可能他們的分析不夠穩健,可以做更徹底的分析,但他們的基本思想是正確的。

引用自:https://stats.stackexchange.com/questions/133329

comments powered by Disqus