Hypothesis-Testing
使用 ANOVA 而不是 t 檢驗來比較兩個均值是錯誤的嗎?
我有工資分佈,我想比較男性和女性的平均收入差異。我知道有用於比較兩種方法的學生 T 檢驗,但是在提出 ANOVA 之後,我收到了一些批評,說 ANOVA 用於比較兩種以上的方法。
使用它僅比較兩種方法有什麼(如果有的話)錯誤?
這沒有錯,相當於假設方差相等的測試。此外,對於兩組,sqrt(f-statistic) 等於 t-statistic 的(絕對值)。我有點相信方差不等的 t 檢驗是不等價的。由於您可以在方差不相等時獲得適當的估計(方差通常總是不等於某個小數位),因此使用 t 檢驗可能是有意義的,因為它比 ANOVA 更靈活(假設您只有兩組)。
更新:
這裡的代碼顯示等方差 t 檢驗的 t-statistic^2,而不是不等 t 檢驗,與 f 統計量相同。
dat_mtcars <- mtcars # unequal variance model t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars) t_stat_unequal <- t_unequal$statistic # assume equal variance t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars) t_stat_equal <- t_equal$statistic # anova a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars) f_stat <- anova(a_equal) f_stat$`F value`[1] # compare by dividing (1 = equivalence) (t_stat_unequal^2) / f_stat$`F value`[1] (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F