Goodness-of-Fit

擬合優度檢驗:關於 Anderson-Darling 檢驗和 Cramér-von Mises 標準的問題

  • August 30, 2013

當我來到Anderson-Darling 檢驗Cramér-von Mises 標準時,我正在閱讀網頁以進行擬合優度檢驗。

到目前為止,我明白了這一點;似乎 Anderson-Darling 檢驗和 Cramer-von Mises 標準相似,只是基於不同的加權函數. 還有一個名為Watson 檢驗的 Cramér–von Mises 標準的變體。

基本上我這裡有兩個問題

  1. 關於這兩種方法的谷歌搜索結果並不多;它們仍然是最先進的嗎?或者已經被一些更好的方法取代了?

這有點令人驚訝,因為根據這篇關於Shapiro-Wilk、Kolmogorov-Smirnov、Lilliefors 和 Anderson-Darling 檢驗的功率比較的論文,AD 的表現相當不錯;總是比 Lilliefors 和 KS 好,並且非常接近專門為正態分佈設計的 SW 檢驗。 2. 此類檢驗的置信區間是多少?

對於 AD、CM 和 Watson 測試,我看到了 wiki 頁面上定義的測試統計變量,但沒有找到置信區間。

KS 測試的情況更簡單:在wiki 頁面上,置信區間定義為,這是從累積分佈函數定義的.

沒有單一的最先進的擬合優度(例如,不存在跨通用替代方案的 UMP 測試,實際上甚至沒有什麼能接近——即使是備受推崇的綜合測試在某些情況下也具有可怕的能力)。

通常,在選擇檢驗統計量時,您會選擇最重要的偏差類型,以檢測並使用擅長該工作的檢驗統計量。一些測試在各種有趣的替代方案上都做得很好,使它們成為不錯的默認選擇,但這並不能使它們成為“最先進的”。

Anderson Darling 仍然很受歡迎,而且有充分的理由。如今,Cramer-von Mises 測試的使用要少得多(令我驚訝的是,它通常比 Kolmogorov-Smirnov 更好,但比 Anderson-Darling 更簡單——並且在“中間”的差異上通常比它具有更好的能力分佈)

所有這些測試都存在對某些替代方案的偏見,並且很容易找到 Anderson-Darling 比其他測試做得更差(非常糟糕)的情況。(正如我所建議的,它更像是“課程的馬”,而不是一個測試來統治它們)。不幸的是,通常很少考慮這個問題(什麼是最好的選擇對我來說最重要的偏差?)。

您可能會在其中一些帖子中找到一些價值:

夏皮羅-威爾克是最好的正態性檢驗嗎?為什麼它可能比 Anderson-Darling 等其他測試更好?

2 樣本 Kolmogorov-Smirnov vs. Anderson-Darling vs Cramer-von-Mises(關於兩個樣本測試,但許多陳述延續

分佈之間 Kolmogorov 距離的動機(更多的理論討論,但有幾個關於實際意義的要點)


我認為您無法在 Cramer-von Mises 和 Anderson Darline 統計中形成 cdf 的置信區間,因為標準基於所有偏差,而不僅僅是最大偏差。

引用自:https://stats.stackexchange.com/questions/68762

comments powered by Disqus