Distributions
為什麼使用 McNemar 的測試𝜒2χ2chi^{2}而不是正態分佈?
我剛剛注意到非精確 McNemar 測試如何使用 $ \chi^{2} $ 漸近分佈。但是由於精確測試(對於兩個案例表)依賴於二項分佈,為什麼建議對二項分佈進行正態近似並不常見?
一個接近直覺的答案:
給定表格,仔細查看 McNemar 檢驗的公式
pos | neg ----|-----|----- pos | a | b ----|-----|----- neg | c | d
McNemar 統計
M
量計算如下:一個的定義k 個自由度的分佈是它由k 個獨立標準正態變量的**平方和組成。**如果 4 個數字足夠大,則
b
和c
,因此b-c
和b+c
可以近似為正態分佈。給定 M 的公式,很容易看出,具有足夠大的值M
確實會遵循大約 a自由度為 1 的分佈。
編輯:正如 onstop 正確指出的那樣,正常的近似值實際上是完全等價的。
b-c
考慮到使用正態分佈近似的論點,這相當微不足道。確切的二項式版本也等價於符號檢驗,因為在這個版本中,二項式分佈用於
b
比較. 或者我們可以說,在原假設下,b 的分佈可以近似為.或者,等效地:
這簡化為
或者,當取兩邊的正方形時,.
因此,使用正態近似。它與近似。