ANOVA 和 Kruskal-Wallis 檢驗之間的區別

November 9, 2013

我正在學習 R 並且一直在嘗試方差分析。我一直在運行
kruskal.test(depVar ~ indepVar, data=df)
和
anova(lm(depVar ~ indepVar, data=dF))
這兩個測試之間有實際區別嗎？我的理解是，他們都評估了總體具有相同均值的零假設。

測試的假設和假設存在差異。

ANOVA（和 t 檢驗）明確地是對值均值相等性的檢驗。Kruskal-Wallis（和 Mann-Whitney）在技術上可以看作是平均排名的比較。

因此，就原始值而言，Kruskal-Wallis 比均值比較更普遍：它測試來自每個組的隨機觀察是否同樣可能高於或低於來自另一組的隨機觀察的概率。作為該比較基礎的真實數據量既不是均值的差異，也不是中位數的差異，（在兩個樣本的情況下）它實際上是所有成對差異的中位數——樣本間的 Hodges-Lehmann 差異。

但是，如果您選擇做出一些限制性假設，那麼 Kruskal-Wallis 可以被視為對人口均值、分位數（例如中位數）以及實際上各種其他度量的相等性的檢驗。也就是說，如果您假設原假設下的組分佈相同，並且在替代方案下，唯一的變化是分佈偏移（所謂的“位置偏移替代方案”），那麼它也是一個檢驗人口均等（以及同時中位數、下四分位數等）。

[如果您確實做出了這個假設，您可以獲得相對變化的估計值和區間，就像使用 ANOVA 一樣。好吧，也可以在沒有這種假設的情況下獲得區間，但它們更難以解釋。]

如果您在這裡查看答案，尤其是在最後，它討論了 t 檢驗和 Wilcoxon-Mann-Whitney 之間的比較，後者（至少在進行雙尾檢驗時）是 ANOVA 和 Kruskal- 的等效* Wallis 僅用於比較兩個樣本；它提供了更多細節，並且大部分討論都延續到了 Kruskal-Wallis vs ANOVA。

*（除了多組比較出現的特定問題，您可能會有非傳遞性成對差異）

您所說的實際差異是什麼意思並不完全清楚。您通常以類似的方式使用它們。當兩組假設都適用時，它們通常傾向於給出相當相似的結果，但在某些情況下它們肯定會給出相當不同的 p 值。

編輯：這是一個即使在小樣本中也有推理相似性的例子——這是從正態分佈（樣本量小）中採樣的三組（第二組和第三組與第一組相比）之間位置偏移的聯合接受區域對於特定的數據集，在 5% 的水平上：

可以看出許多有趣的特徵——在這種情況下，KW 的接受區域略大，其邊界由垂直、水平和對角直線段組成（不難找出原因）。這兩個區域告訴我們關於這裡感興趣的參數的非常相似的事情。

引用自：https://stats.stackexchange.com/questions/76059

ANOVA 和 Kruskal-Wallis 檢驗之間的區別

相關問答

為什麼 ANOVA 不是 p-hacking？

這是p-hacking嗎？

統計測試“穩健”意味著什麼？

是否有統計原因不使用 Satterthwaite 的方法來解釋不等方差？

T檢驗，方差分析或回歸，有什麼區別？

多次表面接觸後手指上的細菌：非正常數據、重複測量、交叉參與者