R

使用 R 進行 Kruskal-Wallis 或 Mann-Whitney U 檢驗的功效分析?

  • September 21, 2013

是否可以對 Kruskal-Wallis 和 Mann-Whitney U 檢驗進行功效分析?如果是,是否有任何 R 包/函數可以執行它?

當然可以計算功率。

更具體地說-如果您做出足夠的假設以獲得可以(以某種方式)計算拒絕概率的情況,則可以計算功率。

在 Wilcoxon-Mann-Whitney 中,如果(例如)您假設分佈形狀(對分佈形式做出假設)並對位置的比例(價差)和特定值或位置差異做出一些假設,您可以通過代數或數值積分來計算功率;否則,您可以模擬拒絕率。

因此,例如,如果我們假設從具有指定位置差異的分佈(標準化為通用尺度),然後給定樣本大小,我們可以模擬滿足所有這些條件的許多數據集,從而獲得拒絕率的估計值。所以讓我們假設我們有兩個樣本具有單位尺度的分佈(位置尺度族)() - 不失一般性 - 並且有位置差異. 同樣,在不失一般性的情況下,我們可以採取. 然後對於一些指定的樣本量——(比如說)——我們可以模擬觀察結果,從而模擬特定值的功率(IE)。這是 R 中的一個簡單示例:

n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res)  # res will be logical ("TRUE" = reject); mean is rej rate

三個類似的模擬產生了 0.321、0.321 和 0.316 的拒絕率;功率顯然在 0.32 附近(您可以僅從這些模擬中的一個計算置信區間,因為拒絕計數是二項式的)。在實踐中,我傾向於使用更大的模擬,但如果你模擬很多不同的的或您可能不想對每個模擬進行超過 10000 次模擬。

通過對位置偏移的許多值執行此操作,您甚至可以獲得該組情況的功率曲線,因為如果您願意,位置偏移會發生變化。

在大樣本中加倍和就像減半(因此增加在給定的) 所以你經常可以在各種情況下得到很好的近似值僅通過少數模擬價值觀。同樣,對於單尾測試,如果是拒絕率然後 趨於接近線性(再次,允許在各種來自模擬的值只有幾個值(十幾個精心選擇的值通常很多)。合理的平滑選擇通常會在其他值下產生非常好的功率近似值或者.

當然,您不必將自己限制在位置變化中。任何可能導致參數變化的參數變化將是您可以調查的事情。

請注意,雖然這些測試在零值下是無分佈的(對於連續分佈),但在備選方案的不同分佈假設下,行為是不同的。

Kruskal-Wallis 的情況類似,但您有更多的位置變化(或您正在查看的任何其他情況)要指定。

此答案中的圖顯示了配對 t 檢驗的功效曲線與特定樣本大小的帶符號秩檢驗的模擬功效的比較,跨越各種標準化位置偏移,用於從具有指定對之間的相關性的正態分佈中採樣。可以對 Mann-Whitney 和 Kruskal-Wallis 進行類似的計算。

引用自:https://stats.stackexchange.com/questions/70643

comments powered by Disqus