Categorical-Data

2 x 2 列聯表的 Yates 連續性校正

  • November 16, 2010

我想從現場人員那裡收集有關 2 x 2 列聯表的 Yates 連續性校正的意見。維基百科文章提到它可能調整得太遠,因此僅在有限的意義上使用。這裡的相關帖子沒有提供更多的見解。

那麼對於經常使用這些測試的人,你的想法是什麼?使用校正是否更好?

還有一個真實世界的例子,它會在 95% 的置信水平下產生不同的結果。請注意,這是一個家庭作業問題,但我們的課程根本不處理 Yates 連續性校正,所以知道你沒有為我做作業,所以睡個好覺。

samp <- matrix(c(13, 12, 15, 3), byrow = TRUE, ncol = 2)
colnames(samp) <- c("No", "Yes")
rownames(samp) <- c("Female", "Male")

chisq.test(samp, correct = TRUE)
chisq.test(samp, correct = FALSE)    

Yates 的修正導致比 Fisher 的“精確”檢驗更保守的檢驗。

這是 Stefanescu 等人編寫的關於使用Yates 連續性校正的在線教程,它清楚地指出了系統性連續性校正的各種缺陷(第 4-6 頁)。引用 Agresti ( CDA 2002),“Yates (1934) 提到 Fisher 建議他使用超幾何進行精確檢驗”,這導致了. Agresti 還指出,Fisher 檢驗是一個很好的選擇,因為計算機甚至可以對大樣本進行檢驗(第 103 頁)。現在,重點是選擇測試實際上取決於所問的問題和每個測試所做的假設(例如,在費舍爾測試的情況下,我們假設邊距是固定的)。

在您的情況下,Fisher 測試並糾正同意並屈服- 值高於 5%。在普通的情況下, 如果- 值是使用蒙特卡洛方法計算的(請參閱 參考資料simulate.p.value),然後它也無法達到顯著性。

處理小樣本量問題和過度使用 Fisher 檢驗的其他有用參考資料包括:

引用自:https://stats.stackexchange.com/questions/4569

comments powered by Disqus