Hypothesis-Testing

比較多組均值的 ANOVA 和比較嵌套模型的 ANOVA 之間有什麼關係?

  • November 27, 2017

到目前為止,我已經看到以兩種方式使用 ANOVA:

首先,在我的介紹性統計文本中,引入了方差分析作為比較三個或更多組的平均值的一種方法,作為對成對比較的改進,以確定其中一個平均值是否具有統計顯著性差異。

其次,在我的統計學習文本中,我看到 ANOVA 用於比較兩個(或更多)嵌套模型,以確定使用模型 2 預測變量子集的模型 1 是否同樣適合數據,或者是否完整模型 2 更勝一籌。

現在我假設在某種程度上,這兩件事實際上非常相似,因為它們都使用 ANOVA 測試,但從表面上看,它們對我來說似乎完全不同。一方面,第一種方法可以比較三個或更多組,而第二種方法只能比較兩個模型。有人介意闡明這兩種用途之間的聯繫嗎?

在我的理解中,ANOVA的抽象直覺如下:分解觀察變量在各個方向的方差來源,並研究各自的貢獻。更準確地說,將恆等映射分解為投影的總和,並研究哪些投影/方向對解釋方差有重要貢獻,哪些沒有。理論基礎是科克倫定理

為了不那麼抽象,我將OP 提到的第二種形式轉換為剛剛描述的框架。隨後,我將第一種形式解釋為第二種形式的特例。

讓我們考慮一個回歸模型解釋變量(完整模型)並將其與受限模型進行比較變量。WLOG,最後一個完整模型的變量不包含在受限模型中。ANOVA回答的問題是

“如果我們包括附加變量”

通過比較第一個的方差貢獻來回答這個問題變量,下一個變量,以及餘數/無法解釋的部分(殘差平方和)。這種分解(例如從 Cochran 定理獲得)用於構建 F 檢驗。因此,我們分析了受限模型(對應於 與最後一個相關的所有係數變量為零)通過包含更多變量並獲得 F 統計量

如果值足夠大,則附加解釋的方差變量是顯著的。 現在,OP 提到的第一種形式被解釋為****第二種形式的特例。考慮三個不同的組 A、B 和 C,, 和. 這通過比較截距回歸解釋的方差(受限模型)與包含截距的完整模型解釋的方差、組 A 的虛擬變量和組 B 的虛擬變量進行測試。得到的 F 統計量

相當於Wikipedia上的 ANOVA-test 。分母等於組內變異,分子等於組間變異。如果組間的變異大於組內的變異,則拒絕所有均值相等的假設。

引用自:https://stats.stackexchange.com/questions/315979

comments powered by Disqus