Data-Visualization

箱線圖缺口與 Tukey-Kramer 區間

  • August 8, 2016

‘R’ 中 boxplot的“缺口”幫助文檔或原始文本)提供以下內容:

如果兩個圖的缺口不重疊,這是兩個中位數不同的“有力證據”(Chambers 等,1983,第 62 頁)。有關使用的計算,請參見 boxplot.stats。

和' boxplot.stats ‘給出以下內容:

槽口(如果需要)擴展到 +/-1.58 IQR/sqrt(n)。這似乎是基於與在 McGill 等人 (1978, p. 16) 中給出的 Chambers 等人 (1983, p. 62) 中的 1.57 公式相同的計算。它們基於中位數的漸近正態性和被比較的兩個中位數大致相等的樣本量,並且據說對樣本的潛在分佈相當不敏感。這個想法似乎是為兩個中位數的差異提供大約 95% 的置信區間。

現在我更熟悉使用 Tukey-Kramer 檢驗的 JMP 版本來比較列的均值。 JMP 的文檔給出了這個:

顯示針對均值之間的所有差異調整大小的檢驗。這是 Tukey 或 Tukey-Kramer HSD(誠實顯著差異)測試。(圖基 1953 年,克萊默 1956 年)。如果樣本大小相同,則該測試是精確的 alpha 級別測試,如果樣本大小不同,則該測試是保守的(Hayter 1984)。

問題:這兩種方法之間的聯繫的性質是什麼?有沒有辦法把一個變成另一個?

看起來有人正在尋找中位數的大約 95% CI,並確定是否存在重疊;另一種是“精確阿爾法測試”(我的樣本大小相同),用於確定兩組樣本的中位數是否在合理範圍內。

我參考了包,但我對邏輯背後的數學很感興趣。

就缺口箱線圖而言,您的問題中提到的 McGill 等人 [1] 參考資料包含非常完整的細節(並非我在這裡所說的所有內容都在那裡明確提及,但仍然足夠詳細,可以弄清楚)。

區間是穩健但基於高斯的區間

該論文引用了以下缺口間隔(其中是樣本中位數和是樣本四分位數範圍):

在哪裡:

  • 是一個漸近轉換因子,用於將 IQR 轉換為– 具體來說,它大約是標準法線的 0.75 分位數和 0.25 分位數之間的差異;人口四分位數約為 1.35分開,所以價值約為應該是一致的(漸近無偏的)估計(更準確地說,約為 1.349)。
  • 之所以出現,是因為我們正在處理中位數的漸近標準誤差,而不是平均值。具體來說,樣本中位數的漸近方差為在哪裡是中位數的密度高度。對於正態分佈,是,所以樣本中位數的漸近標準誤為.

正如 StasK在這裡提到的,較小的是,這將越令人懷疑(將他的第三個理由替換為關於首先使用正態分佈的合理性的理由。

結合以上兩者,我們得到了中位數標準誤的漸近估計,約為 . McGill 等人將此歸功於 Kendall 和 Stuart(我不記得特定公式是否出現在那裡,但組件會出現)。

  • 所以剩下要討論的是1.7的因數。

請注意,如果我們將一個樣本與一個固定值(比如假設的中位數)進行比較,我們將使用 1.96 進行 5% 測試;因此,如果我們有兩個非常不同的標準誤差(一個相對較大,一個非常小),那將是要使用的因子(因為如果 null 為真,則差異幾乎完全是由於具有較大標準誤差,而較小的誤差可以 - 近似 - 被視為有效修復)。

另一方面,如果兩個標準誤差相同,則 1.96 將是一個太大的因素,因為兩組槽口都包含在其中——如果兩組槽口無法重疊,我們將各自添加一個。這將是正確的因素漸近地。

介於兩者之間,我們將 1.7 作為一個粗略的折衷因素。McGill 等人將其描述為“經驗選擇”。它確實非常接近假設特定的方差比率,所以我的猜測(僅此而已)是經驗選擇(可能基於某種模擬)在一組方差的整數比率之間(比如1:1, 2:1,3:1,… ),其中“最佳妥協”來自然後將比率插入四捨五入到兩位數。至少這是最終非常接近 1.7 的合理方式。

將它們全部(1.35、1.25 和 1.7)放在一起得到大約 1.57。一些來源通過更準確地計算 1.35 或 1.25(或兩者)得到 1.58,但作為 1.386 和 1.96 之間的折衷,1.7 甚至不准確到兩個有效數字(這只是一個大概的折衷值),所以額外的精度是毫無意義(他們還不如將整個事情四捨五入到 1.6 並完成它)。

請注意,這裡的任何地方都沒有對多重比較進行調整。


Tukey-Kramer HSD差異的置信限有一些明顯的類比:

但請注意

  • 這是一個組合區間,而不是對差異的兩個單獨貢獻(所以我們在而不是兩個單獨貢獻和我們假設恆定的方差(所以我們不處理與- 當我們可能有非常不同的方差時 - 而不是漸近的案件)
  • 它基於均值,而不是中位數(所以沒有 1.35)
  • 它基於,這又基於均值的最大差異(因此在這一部分中甚至沒有任何1.96 部分,甚至除以)。相比之下,在比較多個箱形圖時,沒有考慮將缺口基於中位數的最大差異,這完全是成對的。

因此,儘管組件形式背後的一些想法有些相似,但實際上它們所做的事情卻大不相同。

[1] McGill, R.、Tukey, JW 和 Larsen, WA (1978)*箱線圖的變化。*美國統計學家 32, 12–16。

引用自:https://stats.stackexchange.com/questions/228719

comments powered by Disqus