Fisher精確檢驗中的檢驗統計量是什麼?
對於 2 x 2 列聯表,有人說Fisher 的精確檢驗使用計數在表中的 (1,1) 單元格中作為檢驗統計量,並在零假設下,將具有超幾何分佈。
有人說它的測試統計是
在哪裡是在 null 下的超幾何分佈(上面提到的)的平均值。它還說p值是根據超高分佈表確定的。我想知道是否有理由減去平均值然後取絕對值?在 null 下沒有超幾何分佈,是嗎?
(為了使我們的概念更準確一點,我們將“檢驗統計量”稱為我們查找以實際計算 p 值的事物的分佈。這意味著對於雙尾 t 檢驗,我們的檢驗統計量將是 $ |T| $ 而不是 $ T $ .)
檢驗統計量的作用是對樣本空間進行排序(或更嚴格地說,是部分排序),以便您可以識別極端情況(與備選方案最一致的情況)。
在 Fisher 精確檢驗的情況下,在某種意義上已經存在排序 - 這是各種 2x2 表本身的概率。碰巧的是,它們對應於上的排序 $ X_{1,1} $ 從某種意義上說,無論是最大值還是最小值 $ X_{1,1} $ 是“極端”的,它們也是概率最小的。所以與其看價值觀 $ X_{1,1} $ 按照您的建議,您可以簡單地從大端和小端開始工作,在每一步只需添加任何值(最大或最小 $ X_{1,1} $ -value not already in there) 具有與之相關的最小概率,一直持續到您到達觀察到的表;包含在內,所有這些極端表的總概率就是 p 值。
這是一個例子:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10))) x prob rank 1 0 1.871194e-04 2 2 1 5.613581e-03 4 3 2 5.052223e-02 6 4 3 1.886163e-01 8 5 4 3.300786e-01 10 6 5 2.829245e-01 9 7 6 1.178852e-01 7 8 7 2.245433e-02 5 9 8 1.684074e-03 3 10 9 3.402171e-05 1
第一列是 $ X_{1,1} $ 值,第二列是概率,第三列是誘導排序。
所以在Fisher精確檢驗的特定情況下,每個表的概率(等效地,每個 $ X_{1,1} $ value) 可以認為是實際的檢驗統計量。
如果您比較建議的測試統計數據 $ |X_{1,1}-\mu| $ ,在這種情況下它會產生相同的排序(我相信它通常會這樣做,但我沒有檢查過),因為該統計量的較大值是概率的較小值,因此它同樣可以被視為“統計量” - 但許多其他數量也可以 - 實際上任何保留這種順序的數量 $ X_{1,1} $ s 在所有情況下都是等效的檢驗統計量,因為它們總是產生相同的 p 值。
還要注意,在開始時引入了更精確的“測試統計”概念,這個問題的所有可能的測試統計實際上都沒有超幾何分佈; $ X_{1,1} $ 確實如此,但它實際上不是雙尾檢驗的合適檢驗統計量(如果我們進行了單邊檢驗,其中只有主對角線中的更多關聯而不是第二對角線中的更多關聯被認為與替代方案一致,那麼它將是檢驗統計量)。這與我開始時的單尾/雙尾問題相同。
[編輯:一些程序確實提供了 Fisher 檢驗的檢驗統計量;我認為這將是一個 -2logL 類型的計算,可以與卡方漸近比較。有些人可能還會顯示賠率比或其對數,但這並不完全等價。]