Chi-Squared-Test

在什麼級別是𝜒2χ2chi^2測試數學上與a相同𝑧zz- 比例測試?

  • September 21, 2015

**背景:**安全跳過 - 它在這裡供參考,並使問題合法化。

這篇論文的開頭寫道:

“Karl Pearson 著名的卡方列聯檢驗源自另一個統計量,稱為 z 統計量,基於正態分佈。最簡單的版本可以證明在數學上與等效 z 檢驗相同。測試在所有情況下都會產生相同的結果。出於所有意圖和目的,“卡方”可以稱為“z 方”。的臨界值對於一個自由度,是 z 的相應臨界值的平方。”

這已在 CV 中多次斷言(hereherehere和其他)。

事實上,我們可以證明相當於和:

讓我們這麼說然後並找到密度通過使用方法:

. 問題是我們不能以緊密的形式整合正態分佈的密度。但我們可以表達:

取導數:

由於正常值是對稱的:

. 將此等同於正常的(現在在裡面將會插入正常的一部分); 並記住包含在最後:

與卡方的 pdf 進行比較:

自從, 為了df,我們準確地推導出了的卡方。

此外,如果我們調用prop.test()R 中的函數,我們調用的是相同的測試好像我們決定chisq.test()

問題:

所以我得到了所有這些要點,但我仍然不知道它們如何應用於這兩個測試的實際實現,原因有兩個:

  1. z 檢驗不是平方的。
  2. 實際測試統計完全不同:

a 的檢驗統計量值是:

在哪裡

= Pearson 的累積檢驗統計量,漸近接近分配。= 類型的觀察次數;= 觀察總數;==類型的預期(理論)頻率, 由零假設斷言類型的分數在人口中是 ; = 表格中的單元格數。

另一方面,檢驗統計量為-測試是:

和, 在哪裡和是“成功”的數量,超過分類變量每個級別中的受試者數量,即和.

這個公式似乎依賴於二項分佈。

這兩個測試統計量明顯不同,導致實際測試統計量以及p值的結果不同5.8481對於2.4183對於 z 檢驗,其中(謝謝​​你,@mark999)。的p值測試是0.01559,而 z 測試是0.0077。雙尾與單尾解釋的差異:(謝謝​​@amoeba)。

那麼我們在什麼層面上說它們是一回事呢?

讓我們有一個 2x2 頻率表,其中列是兩組受訪者,行是兩個回答“是”和“否”。我們已經將頻率轉換為組內的比例,即轉換為垂直剖面

     Gr1   Gr2  Total
Yes   p1    p2     p
No    q1    q2     q
     --------------
    100%  100%   100%
     n1    n2     N

通常(不是耶茨更正)這張表,在你用比例代替公式中的頻率後,看起來像這樣:

請記住, 兩個輪廓的加權平均輪廓的元素(p1,q1)(p2,q2), 並將其代入公式, 得到

分子和分母都除以並得到

“是”響應的比例 z 檢驗的平方 z 統計量。

因此,2x2同質性卡方統計量(和檢驗)等價於兩個比例的 z 檢驗。在給定列中的卡方檢驗中計算的所謂預期頻率是加權(按組n)平均垂直剖面(即“平均組”的剖面)乘以該組的n。因此,卡方檢驗了兩組配置文件中的每一個與該平均組配置文件的偏差,這相當於測試組配置文件彼此之間的差異,這是比例的 z 檢驗。

這是變量關聯度量(卡方)和組差異度量(z 檢驗統計量)之間聯繫的一個演示。屬性關聯和組差異(通常)是同一事物的兩個方面。


(根據@Antoni 的要求,顯示了上面第一行的擴展):

引用自:https://stats.stackexchange.com/questions/173415

comments powered by Disqus