為什麼使用 az test 而不是 at test 與比例數據？

March 21, 2014

在測試兩個比例之間的差異時，為什麼我們使用 z 檢驗而不是 t 檢驗？

此外，是否有一種簡單的方法可以對超過 2 個比例（以百分比的形式）之間的顯著差異進行綜合測試。是否有等效於單向方差分析的方法？我想你可以使用邏輯回歸（假設你有 0 和 1 形式的比例的原始數據）還有其他選擇嗎？

簡短版本：您不使用 t 檢驗，因為明顯的統計數據沒有 t 分佈。它確實（大約）具有 z 分佈。

更長的版本：

在通常的 t 檢驗中，t 統計量都是以下形式： $ \frac{d}{s} $ ，在哪裡 $ s $ 是估計的標準誤差 $ d $ . t 分佈來自以下方面：

$ d $ 是正態分佈的（平均值為 0，因為我們討論的是在 $ H_0 $ )

$ k.s^2 $ 是 $ \chi^2 $ ，對於一些 $ k $ （我不想詳細說明什麼 $ k $ 將是，因為我在這裡涵蓋了許多不同形式的 t 檢驗）

$ d $ 和 $ s $ 是獨立的

這是一組非常嚴格的情況。只有當你有正常數據時，你才能得到所有三個。

相反，如果估計， $ s $ 替換為標準誤的實際值 $ d $ ( $ \sigma_d $ )，這種形式的統計量將有 $ z- $ 分配。

當樣本量足夠大時，類似的統計量 $ d $ 由於中心極限定理，（通常是移動均值或均值差）通常是漸近正態分佈*。

更準確地說，一個標準化的版本 $ d $ , $ d/\sigma_d $ 將是漸近標準正態

許多人認為這立即證明了使用 t 檢驗是合理的，但正如您從上面的列表中看到的那樣，我們只滿足派生 t 檢驗的三個條件中的第一個。

另一方面，還有另一個定理，叫做斯盧茨基定理，可以幫助我們。只要分母在概率上收斂到那個未知的標準誤差， $ \sigma_d $ （一個相當弱的條件），然後 $ d/s $ 應該收斂到標準正態分佈。

通常的一個和兩個樣本比例檢驗就是這種形式，因此我們有理由將它們視為漸近正態，但我們沒有理由將它們視為 $ t $ -分散式。

在實踐中，只要 $ np $ 和 $ n(1-p) $ 不是太小**，一和二樣本比例檢驗的漸近正態性非常迅速（也就是說，通常小得驚人 $ n $ 足以讓這兩個定理“開始”，並且漸近行為成為小樣本行為的良好近似）。

** 儘管還有其他方法可以表徵“足夠大”，但這種形式的條件似乎是最常見的。

雖然我們似乎沒有一個好的論據（至少我沒有看到）可以確定 t 應該比 z 更好，作為任何特定樣本的檢驗統計量的離散分佈的近似值大小，然而在實踐中，通過對 0-1 數據使用 t 檢驗獲得的近似值似乎相當好，只要 z 應該是合理近似值的通常條件成立。

是否有一種簡單的方法可以對兩個以上比例之間的顯著差異進行綜合測試（以百分比的形式）

當然。你可以把它變成卡方檢驗的形式。

（實際上，類似於 ANOVA，您甚至可以構建對比和多重比較等。）

但是，從您的問題中尚不清楚，您的泛化是否將有兩個具有多個類別的樣本，或者俱有兩個類別的多個樣本（或者甚至同時具有兩個，我猜）。無論哪種情況，您都可以獲得卡方。如果您更具體，我應該能夠提供更具體的細節。

引用自：https://stats.stackexchange.com/questions/90893

comments powered by Disqus

為什麼使用 az test 而不是 at test 與比例數據？

相關問答

這是p-hacking嗎？

計算兩個獨立比例之差的標準誤

如何從二元邏輯回歸模型中獲得兩個概率之間差異的置信區間？

t.test 和 prop.test 的 p 值差異很大

為什麼當平均值看起來真的不同時，t.test() 的 p 值在統計上不顯著

具有二分變量的兩組的顯著性檢驗