Machine-Learning

為什麼對於小樣本量,精確檢驗優於卡方檢驗?

  • August 17, 2020

我知道,如果您的預期值在列聯表中較低,則在嘗試測試組的同質性時,諸如費舍爾精確檢驗之類的檢驗有時比卡方更可取(歷史上人們建議使用 5,儘管有些人似乎認為這是保守的) .

但是,我似乎無法解釋為什麼卡方不適用於小樣本量。因此,我有兩個問題:

  1. 是什麼導致列聯表中的期望值隨著樣本量的減少而變小?(我在這裡假設小的期望值是小樣本量的結果)。
  2. 為什麼卡方檢驗不應用於小樣本量?我見過人們說它不能充分近似理論上的卡方分佈,但有人可以解釋為什麼/如何不這樣做嗎?

在經典假設檢驗中,您有一個檢驗統計量,該統計量將證據從最有利於原假設的證據排序到最有利於備擇假設的證據。(不失一般性,假設該統計量的較高值更有利於備擇假設。)檢驗的p 值是觀察證據的概率至少與您實際觀察到的一樣有利於備擇假設(在零假設為真的假設下,檢驗統計量至少與觀察值一樣大。這是根據檢驗統計量的零分佈計算得出的,這是在零假設為真的假設下的分佈。

現在,“精確檢驗”是一種精確計算 p 值的檢驗——即,它從檢驗統計量的真實零分佈中計算出來。在許多統計測試中,真實的零分佈很複雜,但它可以由另一個分佈近似,並且收斂到那個近似分佈 $ n \rightarrow \infty $ . 特別是,所謂的“卡方檢驗”是假設檢驗,其中真實的零分佈收斂到卡方分佈。

因此,在這種“卡方檢驗”中,當您使用卡方分佈計算檢驗的 p 值時,這只是真實 p 值的近似值。檢驗的真實 p 值由精確檢驗給出,您正在使用檢驗統計量的近似空分佈來近似該值。什麼時候 $ n $ 很大這個近似值很好,但是當 $ n $ 很小,近似值可能很差。出於這個原因,統計學家反對使用“卡方檢驗”(即,使用卡方逼近真實的零分佈) $ n $ 是小。


**列聯表中獨立性的卡方檢驗:**現在我將檢查您與卡方檢驗相關的具體問題,以測試列聯表中的獨立性。在這種情況下,如果我們有一個包含觀察計數的列聯表 $ O_1,…,O_K $ 求和 $ n \equiv \sum O_i $ 那麼檢驗統計量就是 Pearson 統計量:

$$ \chi^2 = \sum_{i=1}^K \frac{(O_i-E_i)^2}{E_i}, $$

在哪裡 $ E_1,…,E_K $ 是原假設下的預期單元格值。 $ ^\dagger $ 這里首先要注意的是觀察到的計數 $ O_1,…,O_K $ 是非負整數。對於任何 $ n<\infty $ 這將檢驗統計量的可能值限制為一組有限的可能值,因此其真正的零分佈將是這組有限值的離散分佈。請注意,卡方分佈不可能是真正的零分佈,因為它是所有非負實數的連續分佈——(不可數的)無限組值。

與其他“卡方檢驗”一樣,這裡的檢驗統計量的零分佈很好地近似於卡方分佈,當 $ n $ 很大。您說這是未能“充分近似理論卡方分佈”的問題是不正確的——相反,理論卡方分佈是近似值,而不是真正的零分佈。只要沒有任何值,卡方近似就很好 $ E_1,…,E_K $ 是小。這些期望值對於低值來說很小的原因 $ n $ 就是當您的總計數值較低時,您必須期望至少某些單元格中的計數較低。


$ ^\dagger $ 對於列聯表的分析,這些預期的單元格計數是通過在獨立的零假設下以邊際總數為條件來獲得的。我們沒有必要對這些值進行任何進一步的詳細說明。

引用自:https://stats.stackexchange.com/questions/483472

comments powered by Disqus