Normal-Distribution
二項分佈的正態逼近:為什麼 np>`5?
幾乎每本討論二項分佈的正態近似的教科書都提到了一個經驗法則,即可以使用近似值,如果和. 有些書建議反而。相同的常數經常出現在何時合併單元格的討論中-測試。我找到的所有文本都沒有為這條經驗法則提供理由或參考。
這個常數 5 是從哪裡來的?為什麼不是 4 或 6 或 10?這個經驗法則最初是在哪裡引入的?
維基百科關於二項式分佈的文章提供了一些可能性,在Normal approximation部分下,目前包括以下評論(強調我的):
另一個常用的規則是兩個值和必須大於 5。但是,具體數字因來源而異,取決於人們想要的近似值有多好。
現在,這與確保正常近似落在二項式變量的合法範圍內,.
為了說明這一點,如果我們根據z 分數參數化所需的覆蓋概率 ,那麼我們有
使用二項式矩和, 上述約束要求
所以對於這種方法將對應於覆蓋概率
在哪裡是標準的正常 CDF。 所以在某種程度上這個覆蓋概率是“漂亮的”並且 5 是一個很好的整數……也許可以給出一些理由?我對概率文本沒有太多經驗,所以不能說“5”與其他“特定數字”相比有多常見,以使用維基百科的措辭。我的感覺是 5 並沒有什麼特別之處,維基百科建議 9 也很常見(對應於“漂亮”3)。