Categorical-Data
2 x 2 列聯表的 Yates 連續性校正
我想從現場人員那裡收集有關 2 x 2 列聯表的 Yates 連續性校正的意見。維基百科文章提到它可能調整得太遠,因此僅在有限的意義上使用。這裡的相關帖子沒有提供更多的見解。
那麼對於經常使用這些測試的人,你的想法是什麼?使用校正是否更好?
還有一個真實世界的例子,它會在 95% 的置信水平下產生不同的結果。請注意,這是一個家庭作業問題,但我們的課程根本不處理 Yates 連續性校正,所以知道你沒有為我做作業,所以睡個好覺。
samp <- matrix(c(13, 12, 15, 3), byrow = TRUE, ncol = 2) colnames(samp) <- c("No", "Yes") rownames(samp) <- c("Female", "Male") chisq.test(samp, correct = TRUE) chisq.test(samp, correct = FALSE)
Yates 的修正導致比 Fisher 的“精確”檢驗更保守的檢驗。
這是 Stefanescu 等人編寫的關於使用Yates 連續性校正的在線教程,它清楚地指出了系統性連續性校正的各種缺陷(第 4-6 頁)。引用 Agresti ( CDA 2002),“Yates (1934) 提到 Fisher 建議他使用超幾何進行精確檢驗”,這導致了. Agresti 還指出,Fisher 檢驗是一個很好的選擇,因為計算機甚至可以對大樣本進行檢驗(第 103 頁)。現在,重點是選擇測試實際上取決於所問的問題和每個測試所做的假設(例如,在費舍爾測試的情況下,我們假設邊距是固定的)。
在您的情況下,Fisher 測試並糾正同意並屈服- 值高於 5%。在普通的情況下, 如果- 值是使用蒙特卡洛方法計算的(請參閱 參考資料
simulate.p.value
),然後它也無法達到顯著性。處理小樣本量問題和過度使用 Fisher 檢驗的其他有用參考資料包括:
- I. Campbell、Chi-squared 和 Fisher-Irwin 檢驗 2×2 表的小樣本建議,醫學統計 26(19): 3661-3675, 2007。
- Mark G. Haviland,Yates 的連續性校正和 2 × 2 列聯表分析,醫學統計 9(4): 363–367, 1990。