在什麼情況下，Wilcoxon 的符號秩檢驗優於 t 檢驗或符號檢驗？

November 22, 2016

經過一些討論（如下），我現在對一個重點問題有了更清晰的了解，所以這裡有一個修改後的問題，儘管現在有些評論似乎與原始問題無關。

似乎t 檢驗對於對稱分佈收斂很快，符號秩檢驗假設對稱，並且對於對稱分佈，均值/偽中位數/中位數之間沒有區別。如果是這樣，在什麼情況下，相對缺乏經驗的統計學家會發現符號秩檢驗有用，當他/她同時有 t 檢驗和符號檢驗可用時？如果我的一個（例如社會科學）學生試圖測試一種治療方法是否比另一種治療效果更好（通過一些相對容易解釋的測量方法，例如一些“平均”差異的概念），我正在努力尋找一個地方來簽署 -排名測試，儘管在我的大學似乎普遍教授，而符號測試被忽略了。

考慮一個比正常的重尾分佈，但不是特別“尖峰”的配對差異分佈；那麼通常符號秩檢驗往往會比 t 檢驗更強大，但也比符號檢驗更強大。

例如，在邏輯分佈上，帶符號秩檢驗相對於 t 檢驗的漸近相對效率為 1.097，因此帶符號秩檢驗應該比 t 更強大（至少在較大的樣本中），但漸近相對效率相對於 t 檢驗的符號檢驗的係數為 0.822，因此符號檢驗的效力不如 t（同樣，至少在較大的樣本中）。

隨著我們轉向重尾分佈（同時仍然避免過度尖峰分佈），t 的表現往往會相對較差，而符號測試應該會有所改善，並且符號和符號秩在檢測小顯著的影響（即需要更小的樣本量來檢測影響）。將有一大類分佈，其中帶符號秩檢驗是三者中最好的。

這是一個例子——分配。對於三個測試，在 n = 100 時模擬功率，顯著性水平為 5%。權力為測試標記為黑色，Wilcoxon 符號等級標記為紅色，符號測試標記為綠色。符號檢驗的可用顯著性水平不包括任何特別接近 5% 的值，因此在這種情況下，使用隨機檢驗來接近正確的顯著性水平。x軸是代表從零情況偏移的參數（測試都是雙邊的，因此實際功率曲線將關於 0 對稱）。

正如我們在圖中看到的，符號秩檢驗比符號檢驗具有更大的功效，而符號檢驗又比 t 檢驗具有更大的功效。

引用自：https://stats.stackexchange.com/questions/247275

comments powered by Disqus

在什麼情況下，Wilcoxon 的符號秩檢驗優於 t 檢驗或符號檢驗？

相關問答

這是p-hacking嗎？

t.test 和 prop.test 的 p 值差異很大

為什麼當平均值看起來真的不同時，t.test() 的 p 值在統計上不顯著

具有二分變量的兩組的顯著性檢驗

韋爾奇檢驗似乎比等方差 t 檢驗差得多

有沒有使用的測試|μ一種−μ乙|≤δ|μ一種−μ乙|≤d|{mu_A}-{mu_B}|le delta作為零假設？