Variance

為什麼二項式方差計算為p(1-p)/(n-1)p(1-p)/(n-1)p(1-p) / (n -1)?

  • January 22, 2014

我不得不將幾個給定的統計方程翻譯成代碼,我遇到了這個公式:

簡單隨機樣本的方差

有問題的樣本是為衡量郵政運營商的效率而發送的測試信件。如果按時送達,每封信的值為 1,否則為 0。

參數是已發送信件的總數。

參數是“按時送達的信件數量”和真實效率的估計量。它被定義為從 1 到所有字母值的總和.

我不是統計學專家,但據我所知,方差是樣本均值的平方誤差之和除以. 我在網上找不到任何解釋。誰能解釋一下這個公式?

我認為它已經被 whuber 覆蓋了,但我只想擴展; 它來自哪里以及它是否適用於這裡。

在普通的樣本方差中,許多人使用分母使通常的基於平方和的方差估計無偏(儘管並非每個人都喜歡無偏性而不是其他屬性)。這稱為貝塞爾校正,但似乎是由高斯推導出來的。一個簡單的推導在這裡

據推測,編寫該公式的人得出的結論是,應該對二項式比例的通常方差估計進行相同的估計,通常估計為(在哪裡是樣本比例)。

我們能看到通常方差估計量的期望值是否是總體值?

拿為相應的人口比例。也就是說,是否?

等效地,確實?

請注意,如果是觀察到的計數,,在通常的抽樣假設下,.

因此

看起來(假設我沒有犯錯)這裡也是這種情況 - 比例方差的通常估計量是有偏差的,並且可以通過將典型估計量乘以.

(編輯:回想起來,這很明顯;只需將樣本方差的普通偏差計算應用於 0 和 1 的樣本)

這意味著您選擇的公式似乎是為了給出無偏估計。

(我想知道為什麼人們在其他情況下堅持使用無偏方差估計時,為什麼人們似乎樂於對二項式使用有偏方差估計。我對此沒有很好的答案;只要對我有意義,我將繼續使用有偏估計.)

引用自:https://stats.stackexchange.com/questions/83033

comments powered by Disqus