Confidence-Interval

計算兩個獨立比例之差的標準誤

  • October 10, 2021

**問題來了:**一項針對 500 名男性和 700 名女性的調查顯示,132 名男性和 226 名女性同意特定的說法。使用此信息來計算同意該陳述的男性和女性的比例。這將為您提供 p1 和 p2 的值。使用它來計算 q1 和 q2。現在計算兩個獨立比例之差的標準誤。然後確定 95 置信水平的兩個獨立比例之間差異的置信區間。

我認為我的公式是錯誤的,因為它們不是兩個獨立比例之間差異的標準誤差或兩個獨立比例之間**差異的置信區間,就像這些圖表顯示的那樣,我放大了特定的底部方程。我是仍然不確定 q1 和 q2 指的是什麼。

在此處輸入圖像描述

在此處輸入圖像描述

到目前為止,這是我對公式的了解:

p1 = 0.264 (132/500)
p2 = 0.322857 (226/700)
q1 = 
q2 =

Stdev1 = sqrt (p(1-p)) = (1-0.264)*0.264 = sqrt(0.194304) = 0.44079927404
Stdev2 = sqrt(p(1-p)) = (1-0.322857)*0.322857 = sqrt(0.218620357) = 0.4675685586

Std error = standard deviation / square root(number of samples)
Std error1 = 0.44079927404/sqrt(500) = 0.44079927404/22.360679775 = 0.019713142
Std error2 = 0.4675685586/sqrt(700) = 0.4675685586/26.4575131106 = 0.017672430

Standard deviation = in R it’s sd() and in sd you need series of values, 
   m = mean of values
   x – m = difference of values minus mean
   sum of squared diff from the mean = sum(x-m)^2
   square root [(sum of squared diff from the mean) / (sample size -1)]

Confidence interval (95%)  = 

   Margin of error = Square root [p(1-p)/n]  * 1.96  //n = sample size, 1.96 is 95% confidence interval
   Margin error1 = sqrt(0.194304/500)   * 1.96  = 0.01971314282  * 1.96 = 0.038637759 
   Margin error2 = sqrt(0.218620357/700) ] * 1.96 = 0.01767240787  * 1.96 = 0.034637919 
   
   P + margin of error = Upper confidence interval
       p1 = 0.264+0.038637759 = 0.302637759
       p2 = 0.322857 + 0.034637919 = 0.35749419
   P – margin of error = Lower confidence interval
       p1 = 0.264-0.038637759 = 0.225362241
       p2 = 0.322857 - 0.034637919 = 0.288219081

   P1 CI =  0.225362241 <  0.264 < 0.302637759
   P2 CI =  0.288219081 < 0.322857 < 0.35749419

**男性和女性的置信區間分別。**讓大寫字母表示估計值:同意的男性和女性比例的點估計值是 $ 0.264 $ 和 $ 0.323, $ 分別。基於正態近似的相應 Wald 置信區間為 $ (0.225, 0.303) $ 對於男性和 $ (0.288, 0.357). $

P.m = 132/500;  P.m
[1] 0.264
SE.m = sqrt(P.m*(1-P.m)/500)
CI.m = P.m + qnorm(c(.025,.975))*SE.m
CI.m
[1] 0.225363 0.302637

P.w = 226/700; P.w
[1] 0.3228571
SE.w = sqrt(P.w*(1-P.w)/700);  P.w
CI.w = P.w + qnorm(c(.025,.975))*SE.w
CI.w
[1] 0.2882198 0.3574945

R中的程序binom.test給出(略有不同)精確的二項式置信區間, $ (0.226, 0.305) $ 對於男性和 $ (0.288, 0.359) $ 對於女性,如下圖所示。

binom.test(132,500)$conf.int
[1] 0.2258560 0.3049604
attr(,"conf.level")
[1] 0.95
binom.test(226,700)$conf.int
[1] 0.2883144 0.3589013
attr(,"conf.level")
[1] 0.95

CI代表男女之間的差異。

與您問題中表格的最後一部分和@Ben 的答案 (+1) 一樣,差異的(估計)標準誤差P_w - P_m如下:

SE.d = sqrt(SE.w^2 + SE.m^2);  SE.d
[1] 0.02647495

那麼基於正態近似的差異的 95% 置信區間為 (0.0070, 0.1107),$ 基本相同

P.w-P.m + qnorm(c(.025,.975))*SE.d
[1] 0.006967198 0.110747087

在 R 中,程序prop.test給出相同的 95% 置信區間 $ (0.0070, 0.1107). $ [這個區間也是基於正態近似;由於樣本量大,連續性校正被拒絕。]

prop.test(c(226,132), c(700,500), cor=F)$conf.int
[1] 0.006967198 0.110747087
attr(,"conf.level")
[1] 0.95

請注意,這個 95% 的置信區間不包括 $ 0. $ 因此,女性和男性意見相同的測試在 5% 的水平上被拒絕(反對雙邊選擇)。(近似正態)檢驗的 P 值為 $ 0.028 < 0.05 = 5%. $

prop.test(c(226,132), c(700,500), cor=F)$p.val
[1] 0.02802182

引用自:https://stats.stackexchange.com/questions/547772

comments powered by Disqus