T檢驗，方差分析或回歸，有什麼區別？

April 17, 2019

我知道已經以類似的方式提出了這個問題，但找不到合適的答案來理解它。我定義了三個關於項目參與的子樣本（參與者、輟學和比較），並想分別測試每個組的平均值是否顯著不同於 0。所以，總的來說，我有三個測試，平均值 1 = 平均值 2，平均值 2 = 平均值 3，平均值 1 = 平均值 3

我讀到使用配對 t 檢驗和回歸會產生相同的結果，但是使用 ANOVA 會有細微差別嗎？有人對此有更多了解並可以建議哪一個最適合嗎？

謝謝！

方差分析與 $ t $ -測試

使用 ANOVA，您通常首先執行綜合測試。這是針對所有組均值相等的零假設的檢驗（ $ \mu_1=\mu_2=\mu_3 $ ).

只有當有足夠的證據反對這一假設時，才能運行與使用 3 pairwise非常相似的事後分析 $ t $ - 測試以檢查個體差異。最常用的是稱為 Tukey 的誠實顯著性差異（或 Tukey 的 HSD），它有兩個重要的區別與一系列 $ t $ - 測試：

它使用學生化範圍分佈而不是 $ t $ -分配給 $ p $ -值/置信區間；

默認情況下，它會糾正多個測試。

後者是重要的部分：由於您正在測試三個假設，因此您至少有一個誤報的機會被誇大了。多重測試校正也可應用於三個 $ t $ -tests，但使用 ANOVA + Tukey 的 HSD，這是默認完成的。

第三個區別 $ t $ -tests 是您使用所有數據，而不是每組。這可能是有利的，因為它允許更容易地診斷殘差。但是，這也意味著您可能不得不求助於標準 ANOVA 的替代方案，以防組間的方差不大致相等，或者違反了另一個假設。

方差分析與線性回歸

ANOVA 是一種線性回歸，只增加了截距，沒有通俗意義上的“斜率”。但是，當您對三個類別中的每一個使用帶有虛擬變量的線性回歸時，您將在參數估計方面獲得相同的結果。

不同之處在於您通常會使用線性回歸進行測試的假設。請記住，在方差分析中，測試是：綜合，然後是成對比較。在線性回歸中，您通常測試是否：

$ \beta_0 = 0 $ ，測試截距是否顯著非零；

$ \beta_j = 0 $ ，在哪裡 $ j $ 是你的每一個變量。

如果您只有一個變量（組），其類別之一將成為截距（即參考組）。在這種情況下，大多數統計軟件執行的測試將是：

參考組的估計值是否顯著非零？

是估計 $ (\text{group 1}) - (\text{reference group}) $ 顯著非零？

是估計 $ (\text{group 2}) - (\text{reference group}) $ 顯著非零？

如果您有明確的參考組，這很好，因為您可以簡單地忽略（通常無意義的）截距 $ p $ -value 並且僅更正其他兩個以進行多次測試。這為您節省了一些力量，因為您只糾正了兩個測試而不是三個測試。

總而言之，如果您調用的組comparison實際上是一個對照組，您可能希望使用線性回歸而不是 ANOVA。但是，您說要在問題中進行的三個測試類似於 ANOVA post-hoc 或三個成對測試 $ t $ -測試。

引用自：https://stats.stackexchange.com/questions/403517

comments powered by Disqus

T檢驗，方差分析或回歸，有什麼區別？

方差分析與 $ t $ -測試

方差分析與線性回歸

相關問答

為什麼 ANOVA 不是 p-hacking？

這是p-hacking嗎？

統計測試“穩健”意味著什麼？

t.test 和 prop.test 的 p 值差異很大

為什麼當平均值看起來真的不同時，t.test() 的 p 值在統計上不顯著

具有二分變量的兩組的顯著性檢驗