Hypothesis-Testing

當組合 p 值時,為什麼不只是平均呢?

  • December 4, 2013

我最近了解了 Fisher 合併 p 值的方法。這是基於零下的 p 值服從均勻分佈的事實,並且

我認為這是天才。但我的問題是為什麼要走這種錯綜複雜的方式?為什麼不(有什麼問題)只使用p值的平均值並使用中心極限定理?還是中位數?我試圖了解這個宏偉計劃背後的 RA Fisher 的天才。

你可以完美地使用平均值-價值。

Fisher 方法集設置了一個閾值在, 這樣如果原假設: 全部-值是成立,那麼超過有概率.發生這種情況時被拒絕。

通常需要一個和由分位數給出. 等效地,一個人可以在產品上工作低於有概率. 這是,對於,顯示拒絕區的圖表(紅色)(這裡我們使用. 拒絕區的面積 = 0.05。

費舍爾

現在你可以選擇工作相反,或等效地. 你只需要找到一個門檻這樣在下面有概率; 精確計算很乏味——因為足夠大,您可以依靠中心極限定理;為了,. 下圖顯示了拒絕區(面積再次 = 0.05)。

p 值的總和

正如您可以想像的那樣,拒絕區的許多其他形狀都是可能的,並且已經被提出。尚不清楚哪個更好——即哪個具有更大的權力。

讓我們假設,來自雙邊- 使用非中心參數 1 進行測試:

> p1 <- pchisq( rnorm(1e4, 1, 1)**2, df=1, lower.tail=FALSE )
> p2 <- pchisq( rnorm(1e4, 1, 1)**2, df=1, lower.tail=FALSE )

讓我們看一下散點圖,紅色表示拒絕零假設的點。

散點圖

Fisher 乘積法的功效約為

> sum(p1*p2<exp(-9.49/2))/1e4
[1] 0.2245

基於總和的方法的功率-值大約是

> sum(p1+p2<sqrt(0.1))/1e4
[1] 0.1963

因此,Fisher 的方法獲勝——至少在這種情況下如此。

引用自:https://stats.stackexchange.com/questions/78596

comments powered by Disqus