Kolmogorov Smirnov 與視覺數據衝突
我記錄了 197 次護理事件的長度。我的標準化數據看起來像這樣:
Kolmogorov-Smirnov 給我的 p 值為 0.14。不能肯定是對的嗎?!我是否誤解了我的結果?
我認為您的問題現在已經足夠澄清,可以構建一個體面的答案(有大量鏈接解釋這些問題)。
這裡有幾個問題:
1. 帶有估計參數的 KS 檢驗
樣本均值和 sd (和) 不是總體參數 (和)。
Kolmogorov-Smirnov 檢驗的零分佈(/臨界值)的計算基於完全指定的分佈,而不是估計的分佈——如果使用參數估計,p 值沒有意義。特別是,如果得出測試的條件成立,p 值往往會大於您得到的值。
當您要估計參數時,Kolmogorov-Smirnov 類型的測試稱為Lilliefors測試,它有不同的表。
因此,如果您想對正態性進行 KS 樣式但具有估計的均值和標準差,則 Lilliefors 是正確的測試。不必讓原始論文使用此測試 - 您可以模擬零分佈(並且比 Lilliefors 在 1960 年代能夠做到的準確度要高得多)。
雖然如果測試正態性是目標,Shapiro-Wilk 或 Shapiro-Francia 測試更典型並且具有更好的功效;Anderson-Darling 測試也很常見(參數估計也是 AD 測試的一個問題,但請查看 D’Agostino 和 Stephens 的擬合優度技術中對該問題的討論)。
但是,用您的 p 值確定問題並不意味著擬合優度檢驗可以解決您的原始問題。
2. 對假設它的程序使用正態性假設檢驗
您認為在處理類似 ANOVA 的情況時,適當的措施是通過某種擬合優度測試正式測試正態性,並且只有在拒絕時才考慮非參數測試。我會說這通常不是一個適當的理解。
首先,假設檢驗回答了錯誤的問題;確實,拒絕可以回答您已經知道答案的問題。
如果一個人正在考慮使用依賴於它的程序,那麼對正常性進行一些評估是否合理?當然; 視覺評估 - 診斷,例如 QQ 圖 - 向您展示您的數據出現的非正態性,並讓您了解您所擁有的非正態性的程度和類型是否足以讓您關注您將要執行的特定程序正在申請。
在這種情況下,您的直方圖足以說明“不要假設這是正常的”,儘管通常我不會僅根據直方圖做出這樣的決定
其次,您可以在不測試正態性的情況下進行 Kruskal-Wallis。當數據正常時它是有效的,它只是比通常的 ANOVA 稍微弱一些。
只有 ANOVA 對輕度非正態性相當穩健這一事實才使其在許多情況下成為合理的選擇。如果我預計超過中等偏度或峰度,我會避免假設正常(儘管 Kruskal-Wallis 不是唯一的選擇)。
Khan 和 Rayner (2003),對多樣
本位置問題的常見測試的非正態性魯棒性,
應用數學與決策科學雜誌,7(4),187-206
建議在高峰度的情況下 - 當樣本量不是很小時 - Kruskal Wallis 絕對優於 F 檢驗*(當樣本量較小時,他們建議避免使用 Kruskal-Wallis)
*(當有兩個樣本時,註釋適用於 Mann-Whitney vs t 檢驗)
你當然不需要證明申請 Kruskal-Wallis 的東西是不正常的。
Kruskal Wallis 還有其他不假設正態性的替代方法,例如基於重採樣的測試(隨機化測試、自舉測試)和穩健版本的 ANOVA 類型測試。
另見:
當組大小不相等且殘差不是正態分佈時,ANOVA 的穩健性如何?
3. ANOVA 的假設
ANOVA 不假設整個數字集都是正常的。也就是說,無條件正態性不是方差分析的假設 - 只有條件正態性。
也就是說,您無法真正評估原始數據的方差分析假設;你評估它的殘差。
https://stats.stackexchange.com/a/6351/805
https://stats.stackexchange.com/a/27611/805
還:
https://stats.stackexchange.com/a/9575/805(t-tests,ANOVA 的一個特例)
https://stats.stackexchange.com/a/12266/805 (回歸,ANOVA的泛化)