Chi-Squared-Test
大於 2 x 2 的表的獨立性卡方檢驗的替代方案
如果我不想合併類,對於表大於 2 x 2 且單元格計數小於 5 的分類變量的卡方檢驗有哪些替代方法?
這裡有一些常見的誤解。卡方檢驗非常適合用於大於. 為了使卡方檢驗統計量的實際分佈接近卡方分佈,傳統的建議是所有單元格都有期望值. 這裡必須注意兩點:
- 觀察到的細胞計數是多少並不重要——它們很可能是沒有問題——只有預期的數量很重要。
- 現在眾所周知,這種傳統的經驗法則過於保守。擁有它可能很好具有預期計數的細胞只要沒有預期計數. 看:
- Campbell Ian,2007,2×2 表的卡方檢驗和 Fisher-Irwin 檢驗以及小樣本建議,醫學統計,26,3661 - 3675
如果您的預期計數與這個更準確的標準不匹配,則可以使用一些替代選項:
- 您最好的選擇可能是模擬檢驗統計量的抽樣分佈,或使用置換檢驗。例如,在 R 中,您可以簡單地設置
chisq.test(..., simulate.p.value=TRUE)
. 其他軟件也應該使這成為可能。- 您可以使用替代檢驗,例如 Fisher 精確檢驗。儘管在這種情況下通常建議使用 Fisher 精確檢驗,但值得注意的是,它做出了不同的假設,可能並不合適。也就是說,Fisher 的精確檢驗假設行數和列數是預先設置的,只有行 x 列組合的排列可以改變(請參閱:鑑於當今計算機的能力,是否有理由進行卡方檢驗而不是 Fisher 的精確檢驗?)。如果您對這個假設感到不舒服,模擬卡方將是一個更好的選擇。