在什麼級別是𝜒2χ2chi^2測試數學上與a相同𝑧zz- 比例測試?
**背景:**安全跳過 - 它在這裡供參考,並使問題合法化。
這篇論文的開頭寫道:
“Karl Pearson 著名的卡方列聯檢驗源自另一個統計量,稱為 z 統計量,基於正態分佈。最簡單的版本可以證明在數學上與等效 z 檢驗相同。測試在所有情況下都會產生相同的結果。出於所有意圖和目的,“卡方”可以稱為“z 方”。的臨界值對於一個自由度,是 z 的相應臨界值的平方。”
這已在 CV 中多次斷言(here、here、here和其他)。
事實上,我們可以證明相當於和:
讓我們這麼說然後並找到密度通過使用方法:
. 問題是我們不能以緊密的形式整合正態分佈的密度。但我們可以表達:
取導數:
由於正常值是對稱的:
. 將此等同於正常的(現在在裡面將會插入正常的一部分); 並記住包含在最後:
與卡方的 pdf 進行比較:
自從, 為了df,我們準確地推導出了的卡方。
此外,如果我們調用
prop.test()
R 中的函數,我們調用的是相同的測試好像我們決定chisq.test()
。問題:
所以我得到了所有這些要點,但我仍然不知道它們如何應用於這兩個測試的實際實現,原因有兩個:
- z 檢驗不是平方的。
- 實際測試統計完全不同:
a 的檢驗統計量值是:
在哪裡
= Pearson 的累積檢驗統計量,漸近接近分配。= 類型的觀察次數;= 觀察總數;==類型的預期(理論)頻率, 由零假設斷言類型的分數在人口中是 ; = 表格中的單元格數。
另一方面,檢驗統計量為-測試是:
和, 在哪裡和是“成功”的數量,超過分類變量每個級別中的受試者數量,即和.
這個公式似乎依賴於二項分佈。
這兩個測試統計量明顯不同,導致實際測試統計量以及p值的結果不同:
5.8481
對於2.4183
對於 z 檢驗,其中(謝謝你,@mark999)。的p值測試是0.01559
,而 z 測試是0.0077
。雙尾與單尾解釋的差異:(謝謝@amoeba)。那麼我們在什麼層面上說它們是一回事呢?
讓我們有一個 2x2 頻率表,其中列是兩組受訪者,行是兩個回答“是”和“否”。我們已經將頻率轉換為組內的比例,即轉換為垂直剖面:
Gr1 Gr2 Total Yes p1 p2 p No q1 q2 q -------------- 100% 100% 100% n1 n2 N
通常(不是耶茨更正)這張表,在你用比例代替公式中的頻率後,看起來像這樣:
請記住, 兩個輪廓的加權平均輪廓的元素
(p1,q1)
和(p2,q2)
, 並將其代入公式, 得到分子和分母都除以並得到
“是”響應的比例 z 檢驗的平方 z 統計量。
因此,
2x2
同質性卡方統計量(和檢驗)等價於兩個比例的 z 檢驗。在給定列中的卡方檢驗中計算的所謂預期頻率是加權(按組n
)平均垂直剖面(即“平均組”的剖面)乘以該組的n
。因此,卡方檢驗了兩組配置文件中的每一個與該平均組配置文件的偏差,這相當於測試組配置文件彼此之間的差異,這是比例的 z 檢驗。這是變量關聯度量(卡方)和組差異度量(z 檢驗統計量)之間聯繫的一個演示。屬性關聯和組差異(通常)是同一事物的兩個方面。
(根據@Antoni 的要求,顯示了上面第一行的擴展):