在什麼情況下,Wilcoxon 的符號秩檢驗優於 t 檢驗或符號檢驗?
經過一些討論(如下),我現在對一個重點問題有了更清晰的了解,所以這裡有一個修改後的問題,儘管現在有些評論似乎與原始問題無關。
似乎t 檢驗對於對稱分佈收斂很快,符號秩檢驗假設對稱,並且對於對稱分佈,均值/偽中位數/中位數之間沒有區別。如果是這樣,在什麼情況下,相對缺乏經驗的統計學家會發現符號秩檢驗有用,當他/她同時有 t 檢驗和符號檢驗可用時?如果我的一個(例如社會科學)學生試圖測試一種治療方法是否比另一種治療效果更好(通過一些相對容易解釋的測量方法,例如一些“平均”差異的概念),我正在努力尋找一個地方來簽署 -排名測試,儘管在我的大學似乎普遍教授,而符號測試被忽略了。
考慮一個比正常的重尾分佈,但不是特別“尖峰”的配對差異分佈;那麼通常符號秩檢驗往往會比 t 檢驗更強大,但也比符號檢驗更強大。
例如,在邏輯分佈上,帶符號秩檢驗相對於 t 檢驗的漸近相對效率為 1.097,因此帶符號秩檢驗應該比 t 更強大(至少在較大的樣本中),但漸近相對效率相對於 t 檢驗的符號檢驗的係數為 0.822,因此符號檢驗的效力不如 t(同樣,至少在較大的樣本中)。
隨著我們轉向重尾分佈(同時仍然避免過度尖峰分佈),t 的表現往往會相對較差,而符號測試應該會有所改善,並且符號和符號秩在檢測小顯著的影響(即需要更小的樣本量來檢測影響)。將有一大類分佈,其中帶符號秩檢驗是三者中最好的。
這是一個例子——分配。對於三個測試,在 n = 100 時模擬功率,顯著性水平為 5%。權力為測試標記為黑色,Wilcoxon 符號等級標記為紅色,符號測試標記為綠色。符號檢驗的可用顯著性水平不包括任何特別接近 5% 的值,因此在這種情況下,使用隨機檢驗來接近正確的顯著性水平。x軸是代表從零情況偏移的參數(測試都是雙邊的,因此實際功率曲線將關於 0 對稱)。
正如我們在圖中看到的,符號秩檢驗比符號檢驗具有更大的功效,而符號檢驗又比 t 檢驗具有更大的功效。