計算兩個獨立比例之差的標準誤

October 10, 2021

**問題來了：**一項針對 500 名男性和 700 名女性的調查顯示，132 名男性和 226 名女性同意特定的說法。使用此信息來計算同意該陳述的男性和女性的比例。這將為您提供 p1 和 p2 的值。使用它來計算 q1 和 q2。現在計算兩個獨立比例之差的標準誤。然後確定 95 置信水平的兩個獨立比例之間差異的置信區間。

我認為我的公式是錯誤的，因為它們不是兩個獨立比例之間差異的標準誤差或兩個獨立比例之間**差異的置信區間，就像這些圖表顯示的那樣，我放大了特定的底部方程。我是仍然不確定 q1 和 q2 指的是什麼。

到目前為止，這是我對公式的了解：
p1 = 0.264 (132/500)
p2 = 0.322857 (226/700)
q1 = 
q2 =

Stdev1 = sqrt (p(1-p)) = (1-0.264)*0.264 = sqrt(0.194304) = 0.44079927404
Stdev2 = sqrt(p(1-p)) = (1-0.322857)*0.322857 = sqrt(0.218620357) = 0.4675685586

Std error = standard deviation / square root(number of samples)
Std error1 = 0.44079927404/sqrt(500) = 0.44079927404/22.360679775 = 0.019713142
Std error2 = 0.4675685586/sqrt(700) = 0.4675685586/26.4575131106 = 0.017672430

Standard deviation = in R it’s sd() and in sd you need series of values, 
   m = mean of values
   x – m = difference of values minus mean
   sum of squared diff from the mean = sum(x-m)^2
   square root [(sum of squared diff from the mean) / (sample size -1)]

Confidence interval (95%)  = 

   Margin of error = Square root [p(1-p)/n]  * 1.96  //n = sample size, 1.96 is 95% confidence interval
   Margin error1 = sqrt(0.194304/500)   * 1.96  = 0.01971314282  * 1.96 = 0.038637759 
   Margin error2 = sqrt(0.218620357/700) ] * 1.96 = 0.01767240787  * 1.96 = 0.034637919 
   
   P + margin of error = Upper confidence interval
       p1 = 0.264+0.038637759 = 0.302637759
       p2 = 0.322857 + 0.034637919 = 0.35749419
   P – margin of error = Lower confidence interval
       p1 = 0.264-0.038637759 = 0.225362241
       p2 = 0.322857 - 0.034637919 = 0.288219081

   P1 CI =  0.225362241 <  0.264 < 0.302637759
   P2 CI =  0.288219081 < 0.322857 < 0.35749419

**男性和女性的置信區間分別。**讓大寫字母表示估計值：同意的男性和女性比例的點估計值是和分別。基於正態近似的相應 Wald 置信區間為對於男性和
P.m = 132/500;  P.m
[1] 0.264
SE.m = sqrt(P.m*(1-P.m)/500)
CI.m = P.m + qnorm(c(.025,.975))*SE.m
CI.m
[1] 0.225363 0.302637

P.w = 226/700; P.w
[1] 0.3228571
SE.w = sqrt(P.w*(1-P.w)/700);  P.w
CI.w = P.w + qnorm(c(.025,.975))*SE.w
CI.w
[1] 0.2882198 0.3574945
R中的程序binom.test給出（略有不同）精確的二項式置信區間，對於男性和對於女性，如下圖所示。
binom.test(132,500)$conf.int
[1] 0.2258560 0.3049604
attr(,"conf.level")
[1] 0.95
binom.test(226,700)$conf.int
[1] 0.2883144 0.3589013
attr(,"conf.level")
[1] 0.95
CI代表男女之間的差異。

與您問題中表格的最後一部分和@Ben 的答案 (+1) 一樣，差異的（估計）標準誤差P_w - P_m如下：
SE.d = sqrt(SE.w^2 + SE.m^2);  SE.d
[1] 0.02647495
那麼基於正態近似的差異的 95% 置信區間為 (0.0070, 0.1107),$ 基本相同
P.w-P.m + qnorm(c(.025,.975))*SE.d
[1] 0.006967198 0.110747087
在 R 中，程序prop.test給出相同的 95% 置信區間 [這個區間也是基於正態近似；由於樣本量大，連續性校正被拒絕。]
prop.test(c(226,132), c(700,500), cor=F)$conf.int
[1] 0.006967198 0.110747087
attr(,"conf.level")
[1] 0.95
請注意，這個 95% 的置信區間不包括因此，女性和男性意見相同的測試在 5% 的水平上被拒絕（反對雙邊選擇）。（近似正態）檢驗的 P 值為
prop.test(c(226,132), c(700,500), cor=F)$p.val
[1] 0.02802182

引用自：https://stats.stackexchange.com/questions/547772

計算兩個獨立比例之差的標準誤

相關問答

估計參數函數周圍的置信區間

Westfall 說，“峰度的比例由中央決定μ±σμ±σmupmsigma範圍通常很小”但反過來是真的嗎？

如何從二元邏輯回歸模型中獲得兩個概率之間差異的置信區間？

如何確定樣本是否在多元正態分佈的標準差內

正態分佈中的值之間的平均絕對差是多少？

回歸模型中係數的標準誤差的含義？