Statistical-Significance
什麼是穩健的統計檢驗?什麼是強大的統計檢驗?
有些統計檢驗是穩健的,有些則不是。魯棒性究竟是什麼意思?令人驚訝的是,我在這個網站上找不到這樣的問題。
此外,有時會一起討論測試的穩健性和強大性。直覺上,我無法區分這兩個概念。什麼是強大的測試?它與穩健的統計檢驗有何不同?
穩健性在統計中具有多種含義,但都意味著對所使用數據類型的變化具有一定的彈性。這聽起來可能有點模棱兩可,但那是因為穩健性可以指對變化的不同類型的不敏感。例如:
- 對異常值的魯棒性
- 對非正態性的魯棒性
- 對非常數方差(或異方差)的魯棒性
在測試的情況下,穩健性通常是指在發生這種變化的情況下測試仍然有效。換句話說,結果是否顯著只有在滿足測試假設的情況下才有意義。當這些假設被放寬(即不那麼重要)時,該測試被認為是穩健的。
測試的功效是在存在真正差異時檢測顯著差異的能力。特定測試和模型與各種假設一起使用的原因是這些假設簡化了問題(例如,需要更少的參數來估計)。測試做出的假設越多,它的穩健性就越低,因為必須滿足所有這些假設才能使測試有效。
另一方面,假設較少的測試更穩健。然而,魯棒性通常以功率為代價,因為要么使用來自輸入的更少信息,要么需要估計更多參數。
健壯
的A-test 可以說是穩健的,因為雖然它假設正態分佈的組,但它仍然是比較近似正態分佈的組的有效測試。
當假設-test 滿足,但它更穩健,因為它不假設潛在分佈,因此對非正態數據有效。它的功效通常較低,因為它使用數據的等級,而不是原始數字,因此基本上丟棄了一些信息。
不健壯
的-test 是方差的比較,但對非正態性非常敏感,因此對近似正態性無效。換句話說,-test 不穩健。