Sampling
有限總體校正因子的解釋?
我了解,當從有限總體中抽樣並且我們的樣本量超過總體的 5% 時,我們需要使用以下公式對樣本的均值和標準誤差進行校正:
F磷C=√ñ−nñ−1 $ \hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} $
在哪裡ñ $ N $ 是人口規模和n $ n $ 是樣本量。
我對這個公式有 3 個問題:
- 為什麼閾值設置為 5%?
- 公式是怎麼推導出來的?
- 除了這篇論文,還有其他在線資源可以全面解釋這個公式嗎?
選擇閾值以確保超幾何分佈的收斂(√ñ−nñ−1是它的 SD),而不是二項式分佈(用於帶放回抽樣),到正態分佈(這是中心極限定理,參見例如,正態曲線、中心極限定理,以及隨機變量的馬爾科夫和切比雪夫不等式) . 換句話說,當n/ñ≤0.05(IE,n與ñ),可以放心地忽略 FPC;很容易看出校正因子是如何隨著變化的n對於一個固定的ñ: 和ñ=10,000, 我們有軟板=.9995什麼時候n=10儘管軟板=.3162什麼時候n=9,000. 什麼時候ñ→∞,FPC 接近 1 並且我們接近帶放回抽樣的情況(即,像無限人口)。
要理解這個結果,一個好的起點是閱讀一些關於抽樣理論的在線教程,其中抽樣是在沒有替換的情況下完成的(簡單隨機抽樣)。這個關於非參數統計的在線教程有一個關於計算總期望值和方差的說明。
你會注意到一些作者使用ñ代替ñ−1在 FPC 的分母中;實際上,這取決於您使用的是樣本統計量還是總體統計量:對於方差,它將是ñ代替ñ−1如果你有興趣小號2而不是σ2.
至於在線參考,我可以建議你