Nonparametric

Wilcoxon 符號秩在小樣本中的相對效率

  • October 5, 2013

我在已發表的文獻(並在此處發布)中看到,與 t 檢驗相比,Wilcoxon 符號秩檢驗的漸近相對效率至少為 0.864。我還聽說這僅適用於大樣本,儘管有些書沒有提到這一點(那是什麼?)。

無論如何,我的問題是,在上述段落不再適用之前,事情需要變得多小?

就我而言,我有 4 對數據。如果所有假設都成立,我知道如果我使用 0.1 的 alpha 並且有適度相關的數據,我有至少 90% 的能力來檢測配對 t 檢驗下的 2SD 效應大小。但是,由於樣本量小且無法檢查假設,我想使用 Wilcoxon 符號秩檢驗,但我擔心如果我這樣做,該檢驗的效力會太小。謝謝!

與一個樣本相比, Klotz研究了帶符號秩檢驗的小樣本功效在正常情況下。

[Klotz, J. (1963) “單樣本 Wilcoxon 和正態分數測試的小樣本功效和效率”數理統計年鑑,卷。34,第 2 期,第 624-632 頁]

在和靠近(精確的s 當然是無法實現的,除非你走隨機化路線,大多數人在使用時避免使用,我認為是有道理的)相對效率在正常情況下往往非常接近那裡的 ARE(0.955),儘管接近程度取決於(它隨平均偏移而變化,並且在較小的,效率會更低)。在樣本量小於 10 的情況下,效率通常(略)高一些。

在和(兩者都與接近 0.05),效率在 0.97 左右或更高。

所以,從廣義上講……正常情況下的 ARE 低估了小樣本情況下的相對效率,只要不小。我相信對於雙尾測試你能做到的最小的為 0.125。在那個確切的顯著性水平和样本量下,我認為相對效率在功率感興趣的區域,將同樣高(可能仍在 0.97-0.98 或更高)。

我可能應該回來談談如何進行模擬,這相對簡單。

編輯:

我剛剛做了一個 0.125 級別的模擬(因為在這個樣本量下可以實現);看起來 - 在平均值的一系列差異中,典型的效率有點低,因為, 更多在 0.95-0.97 左右 - 類似於漸近值。


更新

這是正常樣本中 t 檢驗(由 計算)的功效(2 面)圖power.t.test,以及 Wilcoxon 符號秩檢驗的模擬功效 - 每點 40000 次模擬,以 t 檢驗作為控制變量。點位置的不確定性小於一個像素:

t 的功率曲線和 Wilcoxon 的功率曲線


為了使這個答案更完整,我實際上應該看看 ARE 實際上是 0.864(beta(2,2))的情況下的行為。

引用自:https://stats.stackexchange.com/questions/71953

comments powered by Disqus