Multiple-Comparisons

西達克還是邦費羅尼?

  • January 9, 2012

我在 SPSS 中使用廣義線性模型來查看 16 種不同植物的毛蟲平均數量(非正態,使用 Tweedie 分佈)的差異。

我想進行多重比較,但我不確定是否應該使用 Sidak 或 Bonferroni 校正測試。這兩個測試有什麼區別?這個比那個好嗎?

如果你跑使用獨立的統計測試作為您的顯著性水平,並且在每種情況下都會獲得空值,無論您是否會發現“顯著性”只是隨機變量的抽取。具體來說,它取自二項分佈和. 例如,如果您計劃使用 3 個測試,並且(您不知道)實際上每種情況都沒有區別,那麼在每次測試中找到顯著結果的機率為 5%。這樣,第一類錯誤率保持在對於單獨的測試,但在 3 組測試中,長期 I 類錯誤率會更高。如果您認為將這 3 個測試組合/考慮在一起是有意義的,那麼您可能希望將 I 類錯誤率保持在對於整個集合,而不僅僅是單獨的。你應該怎麼做?有兩種方法側重於從原來的轉變(IE,)到一個新的值(即,):

**Bonferroni:**調整用於評估“重要性”,使得

**鄧恩-西達克:**調整使用

(請注意,Dunn-Sidak 假設集合中的所有測試都是相互獨立的,並且如果該假設不成立,可能會產生家庭類型 I 錯誤膨脹。)

重要的是要注意,在進行測試時,您要避免兩種錯誤,I 型(即,說沒有差異有差異)和 II 型(即,說沒有差異)實際存在差異)。通常,當人們討論這個話題時,他們只討論——而且似乎只知道/關心——第一類錯誤。此外,人們經常忽略提及計算的錯誤率只有在所有空值都為真時才成立。很明顯,如果原假設為假,你就不能犯 I 類錯誤,但在討論這個問題時,明確地牢記這一事實很重要。

我提出這一點是因為這些事實的含義似乎經常被忽視。首先,如果,Dunn-Sidak 方法將提供更高的功率(儘管差異可能非常小),因此應始終首選(如果適用)。其次,應該使用“降級”方法。即先測試最大的效果;如果您確信在這種情況下不會獲得 null,那麼 I 類錯誤的最大可能數量是,所以接下來的測試應該做相應的調整,以此類推。(這常常讓人不舒服,看起來像釣魚,但它不是釣魚,因為測試是獨立的,並且您打算在看到數據之前進行它們。這只是一種調整的方式最佳。)

無論您如何評價類型 I 相對於類型 II 錯誤,上述情況都成立。然而,事先沒有理由相信第一類錯誤比第二類錯誤更糟糕(儘管每個人似乎都這麼認為)。相反,這是一個必須由研究人員做出的決定,並且必須針對這種情況。就個人而言,如果我運行的是理論上建議的、先驗的、正交的對比,我通常不會調整.

(再次說明這一點,因為它很重要,以上所有假設都假設測試是獨立的。如果對比不是獨立的,例如當多個治療分別與相同的對照進行比較時,則不同的方法應使用調整,例如 Dunnett 檢驗。)

引用自:https://stats.stackexchange.com/questions/20825

comments powered by Disqus