Regression

T檢驗,方差分析或回歸,有什麼區別?

  • April 17, 2019

我知道已經以類似的方式提出了這個問題,但找不到合適的答案來理解它。我定義了三個關於項目參與的子樣本(參與者、輟學和比較),並想分別測試每個組的平均值是否顯著不同於 0。所以,總的來說,我有三個測試,平均值 1 = 平均值 2,平均值 2 = 平均值 3,平均值 1 = 平均值 3

我讀到使用配對 t 檢驗和回歸會產生相同的結果,但是使用 ANOVA 會有細微差別嗎?有人對此有更多了解並可以建議哪一個最適合嗎?

謝謝!

方差分析與 $ t $ -測試

使用 ANOVA,您通常首先執行綜合測試。這是針對所有組均值相等的零假設的檢驗( $ \mu_1=\mu_2=\mu_3 $ ).

只有當有足夠的證據反對這一假設時,才能運行與使用 3 pairwise非常相似的事後分析 $ t $ - 測試以檢查個體差異。最常用的是稱為 Tukey 的誠實顯著性差異(或 Tukey 的 HSD),它有兩個重要的區別與一系列 $ t $ - 測試:

  • 它使用學生化範圍分佈而不是 $ t $ -分配給 $ p $ -值/置信區間;
  • 默認情況下,它會糾正多個測試。

後者是重要的部分:由於您正在測試三個假設,因此您至少有一個誤報的機會被誇大了。多重測試校正也可應用於三個 $ t $ -tests,但使用 ANOVA + Tukey 的 HSD,這是默認完成的。

第三個區別 $ t $ -tests 是您使用所有數據,而不是每組。這可能是有利的,因為它允許更容易地診斷殘差。但是,這也意味著您可能不得不求助於標準 ANOVA 的替代方案,以防組間的方差不大致相等,或者違反了另一個假設。

方差分析與線性回歸

ANOVA 是一種線性回歸,只增加了截距,沒有通俗意義上的“斜率”。但是,當您對三個類別中的每一個使用帶有虛擬變量的線性回歸時,您將在參數估計方面獲得相同的結果。

不同之處在於您通常會使用線性回歸進行測試的假設。請記住,在方差分析中,測試是:綜合,然後是成對比較。在線性回歸中,您通常測試是否:

  • $ \beta_0 = 0 $ ,測試截距是否顯著非零;
  • $ \beta_j = 0 $ , 在哪裡 $ j $ 是你的每一個變量。

如果您只有一個變量(組),其類別之一將成為截距(即參考組)。在這種情況下,大多數統計軟件執行的測試將是:

  • 參考組的估計值是否顯著非零?
  • 是估計 $ (\text{group 1}) - (\text{reference group}) $ 顯著非零?
  • 是估計 $ (\text{group 2}) - (\text{reference group}) $ 顯著非零?

如果您有明確的參考組,這很好,因為您可以簡單地忽略(通常無意義的)截距 $ p $ -value 並且僅更正其他兩個以進行多次測試。這為您節省了一些力量,因為您只糾正了兩個測試而不是三個測試。

總而言之,如果您調用的組comparison實際上是一個對照組,您可能希望使用線性回歸而不是 ANOVA。但是,您說要在問題中進行的三個測試類似於 ANOVA post-hoc 或三個成對測試 $ t $ -測試。

引用自:https://stats.stackexchange.com/questions/403517

comments powered by Disqus