Hypothesis-Testing

使用 ANOVA 而不是 t 檢驗來比較兩個均值是錯誤的嗎?

  • September 25, 2016

我有工資分佈,我想比較男性和女性的平均收入差異。我知道有用於比較兩種方法的學生 T 檢驗,但是在提出 ANOVA 之後,我收到了一些批評,說 ANOVA 用於比較兩種以上的方法。

使用它僅比較兩種方法有什麼(如果有的話)錯誤?

這沒有錯,相當於假設方差相等的測試。此外,對於兩組,sqrt(f-statistic) 等於 t-statistic 的(絕對值)。我有點相信方差不等的 t 檢驗是不等價的。由於您可以在方差不相等時獲得適當的估計(方差通常總是不等於某個小數位),因此使用 t 檢驗可能是有意義的,因為它比 ANOVA 更靈活(假設您只有兩組)。

更新:

這裡的代碼顯示等方差 t 檢驗的 t-statistic^2,而不是不等 t 檢驗,與 f 統計量相同。

dat_mtcars <- mtcars

# unequal variance model
t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
t_stat_unequal <-  t_unequal$statistic

# assume equal variance
t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
t_stat_equal <- t_equal$statistic

# anova
a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
f_stat <- anova(a_equal)
f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
(t_stat_unequal^2) / f_stat$`F value`[1] 
(t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F

引用自:https://stats.stackexchange.com/questions/236877

comments powered by Disqus