Anova

實際上,當數據不完全符合假設時,人們如何處理方差分析?

  • May 9, 2014

這不是一個嚴格的統計問題——我可以閱讀所有關於方差分析假設的教科書——我試圖弄清楚實際工作的分析師如何處理不完全符合假設的數據。我在這個網站上經歷了很多問題來尋找答案,我一直在尋找關於何時不使用 ANOVA(在抽象的、理想化的數學環境中)或如何做我在 R 中描述的一些事情的帖子。 ‘我真的很想弄清楚人們實際上做出了什麼決定以及為什麼。

我正在對來自四組樹(實際樹,而不是統計樹)的分組數據進行分析。我已經為每棵樹獲得了大約 35 個屬性的數據,並且我正在檢查每個屬性以確定組在該屬性上是否存在顯著差異。但是,在某些情況下,由於方差不相等(根據 Levene 檢驗,使用 alpha=.05),稍微違反了 ANOVA 假設。

在我看來,我的選擇是: 1. 對數據進行功率轉換,看看它是否會改變 Levene p-val。2. 使用像 Wilcoxon 這樣的非參數檢驗(如果是,是哪一個?)。3. 對 ANOVA 結果進行某種修正,例如 Bonferroni(我實際上不確定是否存在這樣的東西?)。我已經嘗試了前兩個選項,得到的結果略有不同——在某些情況下,一種方法很重要,而另一種方法則不然。我害怕陷入 p 值釣魚陷阱,我正在尋找可以幫助我證明使用哪種方法的建議。

我還閱讀了一些內容,表明異方差對於方差分析來說並不是什麼大問題,除非均值和方差是相關的(即它們一起增加),所以也許我可以忽略 Levene 的結果,除非我看到一個像這樣的圖案?如果是這樣,是否對此進行了測試?

最後,我應該補充一點,我正在為發表在同行評審期刊上做這個分析,所以無論我決定採用哪種方法,都必須通過審稿人的認可。因此,如果有人可以提供指向類似的已發布示例的鏈接,那就太好了。

我試圖弄清楚實際工作的分析師如何處理不完全符合假設的數據。

這取決於我的需求、違反了哪些假設、以何種方式違反、有多嚴重、影響推理的程度,有時還取決於樣本量。

我正在對來自四組樹的分組數據進行分析。我已經為每棵樹獲得了大約 35 個屬性的數據,並且我正在檢查每個屬性以確定組在該屬性上是否存在顯著差異。但是,在某些情況下,由於方差不相等(根據 Levene 檢驗,使用 alpha=.05),稍微違反了 ANOVA 假設。

1)如果樣本量相等,那麼您沒有太大問題。如果 n 相等,則 ANOVA 對不同的方差非常(水平)穩健。

2)在決定是否假設它被許多研究推薦之前*測試方差相等。*如果您對它們是否接近相等有任何真正的疑問,最好簡單地假設它們是不相等的。

一些參考資料:

Zimmerman, DW (2004),

“關於方差相等性初步檢驗的說明”。

兄弟。J.數學。統計。心理學。,五月; 57(第 1 部分):173-81。

http://www.ncbi.nlm.nih.gov/pubmed/15171807

Henrik在這裡給出了三個參考

3)重要的是效果大小,而不是您的樣本是否足夠大以告訴您它們有顯著差異。因此,在大樣本中,Levene 檢驗表明方差的微小差異非常顯著,但對其影響基本上沒有影響。如果樣本很大並且影響大小(方差比率或方差差異)非常接近應有的值,則 p 值無關緊要。(另一方面,在小樣本中,一個好的大 p 值並不能讓人感到舒服。無論哪種方式,測試都沒有回答正確的問題。)

請注意,方差分析中對殘差標準誤差和 df 的估計有 Welch-Satterthwaite 類型調整,就像在兩個樣本 t 檢驗中一樣。

  1. 使用像 Wilcoxon 這樣的非參數測試(如果是,是哪一個?)。

如果您對位置轉移替代方案感興趣,那麼您仍然假設不斷傳播。如果您對更通用的替代方案感興趣,那麼您可能會考慮它;與 Wilcoxon 檢驗等效的 k 樣本是 Kruskal-Wallis 檢驗。

對方差分析結果進行某種校正

請參閱我上面關於考慮 Welch-Satterthwaite 的建議,這是一種“修正”。

(或者,您可以將 ANOVA 轉換為一組成對的 Welch 型 t 檢驗,在這種情況下,您可能希望查看 Bonferroni 或類似的東西)

我還閱讀了一些內容,表明異方差性對於 ANOVA 來說並不是什麼大問題,除非均值和方差是相關的(即它們都一起增加)

你必須引用類似的東西。用 t-tests 查看了許多情況,我認為這不是很明顯,所以我想看看他們為什麼這麼認為;也許這種情況在某種程度上受到了限制。不過,如果是這樣就好了,因為通常廣義的線性模型可以幫助解決這種情況。

最後,我應該補充一點,我正在為發表在同行評審期刊上做這個分析,所以無論我決定採用哪種方法,都必須通過審稿人的認可。

很難預測什麼會讓你的評論者滿意。我們大多數人不使用樹木。

引用自:https://stats.stackexchange.com/questions/97098

comments powered by Disqus