Confidence-Interval
百分位數與置信區間的關係(均值)
當有人問我百分位數和置信區間之間的關係是什麼時,這個問題在工作中出現了,我很難表達我的想法。上下文是一個關於估計樣本均值的 95% 置信區間的非常簡單的問題。
我知道中心極限定理指出,如果樣本量足夠大,任何獨立隨機變量的均值的抽樣分佈將是正態或接近正態的。因此,樣本均值服從正態分佈在哪裡是樣本標準差。
現在,假設原假設是真的。那麼在原假設下,樣本均值周圍的 95% 置信區間為
我同事的問題具體如下:標準誤差只是平均值抽樣分佈的標準偏差。因此,將相當於通過計算許多大小樣本的樣本均值創建的分佈的 97.5 個百分位?
這個問題對我來說真的很奇怪,因為百分位數和置信區間是兩個獨立的概念,而我同事的問題是詢問兩者之間的關係,我很困惑,但無法表達我的觀點。
任何幫助將不勝感激!
您的同事是正確的,置信區間基於感興趣的統計數據的抽樣分佈的百分位數。在這種情況下,統計量是. 的百分位數是不同的。
您可以嘗試自己進行繪製許多圖的實驗併計算他們的百分位數。你會發現與正規理論公式的一致性很好對於每個足夠大。如果你繼續思考它,你最終可能會重新發明引導程序,它使用觀察到的百分位數產生許多然後使用此生成樣本的百分位數來創建置信區間。