使用 ANOVA 而不是 t 檢驗來比較兩個均值是錯誤的嗎？

September 25, 2016

我有工資分佈，我想比較男性和女性的平均收入差異。我知道有用於比較兩種方法的學生 T 檢驗，但是在提出 ANOVA 之後，我收到了一些批評，說 ANOVA 用於比較兩種以上的方法。

使用它僅比較兩種方法有什麼（如果有的話）錯誤？

這沒有錯，相當於假設方差相等的測試。此外，對於兩組，sqrt(f-statistic) 等於 t-statistic 的（絕對值）。我有點相信方差不等的 t 檢驗是不等價的。由於您可以在方差不相等時獲得適當的估計（方差通常總是不等於某個小數位），因此使用 t 檢驗可能是有意義的，因為它比 ANOVA 更靈活（假設您只有兩組）。

更新：

這裡的代碼顯示等方差 t 檢驗的 t-statistic^2，而不是不等 t 檢驗，與 f 統計量相同。
dat_mtcars <- mtcars

# unequal variance model
t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
t_stat_unequal <-  t_unequal$statistic

# assume equal variance
t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
t_stat_equal <- t_equal$statistic

# anova
a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
f_stat <- anova(a_equal)
f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
(t_stat_unequal^2) / f_stat$`F value`[1] 
(t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F

引用自：https://stats.stackexchange.com/questions/236877

comments powered by Disqus

使用 ANOVA 而不是 t 檢驗來比較兩個均值是錯誤的嗎？

更新：

相關問答

為什麼 ANOVA 不是 p-hacking？

這是p-hacking嗎？

統計測試“穩健”意味著什麼？

t.test 和 prop.test 的 p 值差異很大

為什麼當平均值看起來真的不同時，t.test() 的 p 值在統計上不顯著

具有二分變量的兩組的顯著性檢驗