為什麼中位數的 95% CI 應該是±1.57𝐼𝑄𝑅/𝑁‾‾√±1.57一世問R/ñ±1.57*IQR/sqrt{N}?

December 1, 2015

在各種來源（參見例如此處）中，給出了中位數置信區間的以下公式（特別是為了在盒須圖上繪製缺口）：

魔法常數讓我發瘋，我無法弄清楚它是如何獲得的。各種近似（例如，假設我們的分佈是高斯分佈和很大）沒有給出任何線索——我得到了不同的常數值。

這很容易。如果我們查看引入缺口盒須圖的原始論文（Robert McGill、John W. Tukey 和 Wayne A. Larsen. Variations of Box Plots, The American Statistician, Vol. 32, No. 1 (Feb., 1978), pp. 12-16 ; 幸運的是，它在 JSTOR 上)，我們發現第 7 節，該公式通過以下方式得到證明：

如果需要一個表示每個中位數的 95% 置信區間的缺口，將使用 C=1.96。*[這裡的 C 是不同的常數，與我們的相關，但確切的關係並不重要，稍後將清楚 - IS]*然而，由於需要一種“間隙規”形式，表明在 95% 水平上存在顯著差異，這沒有做。可以證明，只有當兩組的標準差相差很大時，C = 1.96 才合適。如果它們幾乎相等，則 C = 1.386 將是合適的值，1.96 會導致測試過於嚴格（遠遠超過 99%）。 這些限制之間的值，C = 1.7，根據經驗選擇為優選的。 因此，使用的缺口計算為.

重點是我的。注意，這是你的幻數。

因此，簡短的回答是：它不是中位數 CI 的通用公式，而是用於可視化的特定工具，並且根據經驗選擇常數以實現特定目標。

沒有魔法。

對不起。

引用自：https://stats.stackexchange.com/questions/184516

comments powered by Disqus

為什麼中位數的 95% CI 應該是±1.57𝐼𝑄𝑅/𝑁‾‾√±1.57一世問R/ñ±1.57*IQR/sqrt{N}?

相關問答

為什麼分量中位數在更高維度上沒有意義？

有人可以給出平均絕對誤差和中位數背後的直覺嗎？[複製]

箱線圖的歷史是什麼，“箱線圖”設計是如何演變的？

是否有不止一個“中位數”公式？

為什麼最小化 MAE 會導致預測中位數而不是均值？

檢驗中位數差異