Hypothesis-Testing
為什麼統計文獻中沒有那麼多強調 II 型錯誤?
我已經在各種研究文章中看到了許多 I 類錯誤被解釋(用 alpha 值表示)的情況。我發現研究人員很少會考慮功率或 II 型錯誤。
II 型錯誤可能很嚴重,對嗎?當它實際上是錯誤的時,我們不小心拒絕了替代假設。為什麼如此強調阿爾法值而不是貝塔值?
當我學習第一年的統計數據時,我從來沒有被教過測試版——只有阿爾法版。我覺得這兩個錯誤應該平等對待。然而,似乎只強調了阿爾法。
這是一個很好的問題。讓我從幾個澄清開始:
- 對於“[t] II 型錯誤 [to] 很重要”(或 I 型錯誤)來說,這並不意味著任何事情。當然,我們錯過了真正的效果 可能非常重要。
- 此外,我們通常不會“[接受] 原假設”。(有關更多信息,在這裡閱讀我的答案可能會有所幫助:為什麼統計學家說不顯著的結果意味著“你不能拒絕零”而不是接受零假設?)
我認為您(不幸地)是對的,即較少關注權力和 II 型錯誤。雖然我認為生物醫學研究的情況正在改善(例如,資助機構和 IRB 現在經常需要進行功率分析),但我認為有以下幾個原因:
- 我認為權力對於人們來說比簡單的意義更難理解。(這部分是因為它取決於很多未知數——尤其是效應大小,但還有其他的)。
- 大多數科學(即,除了物理和化學)都沒有很好地數學化。因此,研究人員很難知道他們的理論“應該”給出多大的效應大小(不僅僅是)。
- 科學家們傳統上認為 I 型錯誤比 II 型錯誤更糟糕。