Confidence-Interval
為什麼中位數的 95% CI 應該是±1.57𝐼𝑄𝑅/𝑁‾‾√±1.57一世問R/ñ±1.57*IQR/sqrt{N}?
在各種來源(參見例如此處)中,給出了中位數置信區間的以下公式(特別是為了在盒須圖上繪製缺口):
魔法常數讓我發瘋,我無法弄清楚它是如何獲得的。各種近似(例如,假設我們的分佈是高斯分佈和很大)沒有給出任何線索——我得到了不同的常數值。
這很容易。如果我們查看引入缺口盒須圖的原始論文(Robert McGill、John W. Tukey 和 Wayne A. Larsen. Variations of Box Plots, The American Statistician, Vol. 32, No. 1 (Feb., 1978), pp. 12-16 ; 幸運的是,它在 JSTOR 上),我們發現第 7 節,該公式通過以下方式得到證明:
如果需要一個表示每個中位數的 95% 置信區間的缺口,將使用 C=1.96。*[這裡的 C 是不同的常數,與我們的相關,但確切的關係並不重要,稍後將清楚 - IS]*然而,由於需要一種“間隙規”形式,表明在 95% 水平上存在顯著差異,這沒有做。可以證明,只有當兩組的標準差相差很大時,C = 1.96 才合適。如果它們幾乎相等,則 C = 1.386 將是合適的值,1.96 會導致測試過於嚴格(遠遠超過 99%)。 這些限制之間的值,C = 1.7,根據經驗選擇為優選的。 因此,使用的缺口計算為.
重點是我的。注意,這是你的幻數。
因此,簡短的回答是:它不是中位數 CI 的通用公式,而是用於可視化的特定工具,並且根據經驗選擇常數以實現特定目標。
沒有魔法。
對不起。