測試兩個二項分佈是否在統計上彼此不同
我有三組數據,每組都有一個二項分佈(即每組都有成功或失敗的元素)。我沒有預測的成功概率,而是只能依靠每個成功率作為真實成功率的近似值。我只發現了這個問題,它很接近,但似乎並不能完全處理這種情況。
為了簡化測試,假設我有 2 個組(可以從這個基本案例擴展 3 個)。
我沒有預期的成功概率,只有我從樣本中知道的。
每個樣本的成功率都相當接近。但是我的樣本量也很大。如果我檢查二項分佈的 CDF 以查看它與第一個分佈有多大不同(我假設第一個是空測試),我得到第二個可以實現的概率非常小。
在 Excel 中:
1-BINOM.DIST(1556,2455,61.2%,TRUE) = 0.012
但是,這沒有考慮第一個結果的任何方差,它只是假設第一個結果是測試概率。
有沒有更好的方法來測試這兩個數據樣本是否在統計上實際上彼此不同?
解決方案是一個簡單的谷歌:http ://en.wikipedia.org/wiki/Statistical_hypothesis_testing
因此,您想針對給定的備選方案檢驗以下零假設
$ H_0:p_1=p_2 $ 相對 $ H_A:p_1\neq p_2 $
所以你只需要計算測試統計量
$$ z=\frac{\hat p_1-\hat p_2}{\sqrt{\hat p(1-\hat p)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}} $$
在哪裡 $ \hat p=\frac{n_1\hat p_1+n_2\hat p_2}{n_1+n_2} $ .
所以現在,在你的問題中, $ \hat p_1=.634 $ , $ \hat p_2=.612 $ , $ n_1=2455 $ 和 $ n_2=2730. $
計算出檢驗統計量後,您只需計算相應的臨界區值即可比較您的檢驗統計量。例如,如果您在 95% 的置信水平上檢驗這個假設,那麼您需要將檢驗統計量的絕對值與臨界區值進行比較 $ z_{\alpha/2}=1.96 $ (對於這兩個尾測試)。
現在,如果 $ |z|>z_{\alpha/2} $ 那麼你可以拒絕原假設,否則你一定不能拒絕原假設。
好吧,此解決方案適用於您比較兩組的情況,但它並不能推廣到您想要比較 3 組的情況。
但是,您可以使用卡方檢驗來測試所有三個組是否具有相同的比例,正如@Eric 在上面的評論中所建議的那樣:“這個問題有幫助嗎?stats.stackexchange.com/questions/25299/ … – Eric”