Self-Study

拋硬幣時應該使用二項式 cdf 還是普通 cdf?

  • January 18, 2012

硬幣需要進行公平性測試。50 次翻轉後出現 30 個正面。假設硬幣是公平的,你在 50 次翻轉中至少得到 30 個正面的概率是多少?

根據我的老師的說法,解決這個問題的正確方法是

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

但是,我採用了這樣的二項式累積分佈函數

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

我相信滿足二項分佈的標準:單個事件是獨立的,只有兩種可能的結果(正面與反面),問題的概率是恆定的(0.5),試驗次數固定為 50 . 然而顯然,這兩種方法給出了不同的答案,並且模擬支持了我的答案(至少我運行了幾次;顯然,我不能保證你會得到相同的結果)。

我的老師是否錯誤地假設正態分佈曲線也是解決這個問題的有效方法(從來沒有說分佈是正態的,但是npn*(1-p)*都大於10),還是我對二項分佈有誤解?

這是whuber和onestop的答案的插圖。

連續性校正

紅色為二項分佈,黑色表示正態近似的密度,藍色的表面對應於為了.

對應的紅色條的高度為了很好地近似於. 為了得到一個很好的近似值,你需要使用.

(編輯)這是

(在 R 中由 獲得1-pnorm(29.5,25,sqrt(12.5)))而

近似值是正確的。 這稱為連續性校正。它允許您計算甚至“點概率”,例如:

引用自:https://stats.stackexchange.com/questions/21297

comments powered by Disqus