計算兩個獨立比例之差的標準誤
**問題來了:**一項針對 500 名男性和 700 名女性的調查顯示,132 名男性和 226 名女性同意特定的說法。使用此信息來計算同意該陳述的男性和女性的比例。這將為您提供 p1 和 p2 的值。使用它來計算 q1 和 q2。現在計算兩個獨立比例之差的標準誤。然後確定 95 置信水平的兩個獨立比例之間差異的置信區間。
我認為我的公式是錯誤的,因為它們不是兩個獨立比例之間差異的標準誤差或兩個獨立比例之間**差異的置信區間,就像這些圖表顯示的那樣,我放大了特定的底部方程。我是仍然不確定 q1 和 q2 指的是什麼。
到目前為止,這是我對公式的了解:
p1 = 0.264 (132/500) p2 = 0.322857 (226/700) q1 = q2 = Stdev1 = sqrt (p(1-p)) = (1-0.264)*0.264 = sqrt(0.194304) = 0.44079927404 Stdev2 = sqrt(p(1-p)) = (1-0.322857)*0.322857 = sqrt(0.218620357) = 0.4675685586 Std error = standard deviation / square root(number of samples) Std error1 = 0.44079927404/sqrt(500) = 0.44079927404/22.360679775 = 0.019713142 Std error2 = 0.4675685586/sqrt(700) = 0.4675685586/26.4575131106 = 0.017672430 Standard deviation = in R it’s sd() and in sd you need series of values, m = mean of values x – m = difference of values minus mean sum of squared diff from the mean = sum(x-m)^2 square root [(sum of squared diff from the mean) / (sample size -1)] Confidence interval (95%) = Margin of error = Square root [p(1-p)/n] * 1.96 //n = sample size, 1.96 is 95% confidence interval Margin error1 = sqrt(0.194304/500) * 1.96 = 0.01971314282 * 1.96 = 0.038637759 Margin error2 = sqrt(0.218620357/700) ] * 1.96 = 0.01767240787 * 1.96 = 0.034637919 P + margin of error = Upper confidence interval p1 = 0.264+0.038637759 = 0.302637759 p2 = 0.322857 + 0.034637919 = 0.35749419 P – margin of error = Lower confidence interval p1 = 0.264-0.038637759 = 0.225362241 p2 = 0.322857 - 0.034637919 = 0.288219081 P1 CI = 0.225362241 < 0.264 < 0.302637759 P2 CI = 0.288219081 < 0.322857 < 0.35749419
**男性和女性的置信區間分別。**讓大寫字母表示估計值:同意的男性和女性比例的點估計值是 $ 0.264 $ 和 $ 0.323, $ 分別。基於正態近似的相應 Wald 置信區間為 $ (0.225, 0.303) $ 對於男性和 $ (0.288, 0.357). $
P.m = 132/500; P.m [1] 0.264 SE.m = sqrt(P.m*(1-P.m)/500) CI.m = P.m + qnorm(c(.025,.975))*SE.m CI.m [1] 0.225363 0.302637 P.w = 226/700; P.w [1] 0.3228571 SE.w = sqrt(P.w*(1-P.w)/700); P.w CI.w = P.w + qnorm(c(.025,.975))*SE.w CI.w [1] 0.2882198 0.3574945
R中的程序
binom.test
給出(略有不同)精確的二項式置信區間, $ (0.226, 0.305) $ 對於男性和 $ (0.288, 0.359) $ 對於女性,如下圖所示。binom.test(132,500)$conf.int [1] 0.2258560 0.3049604 attr(,"conf.level") [1] 0.95 binom.test(226,700)$conf.int [1] 0.2883144 0.3589013 attr(,"conf.level") [1] 0.95
CI代表男女之間的差異。
與您問題中表格的最後一部分和@Ben 的答案 (+1) 一樣,差異的(估計)標準誤差
P_w - P_m
如下:SE.d = sqrt(SE.w^2 + SE.m^2); SE.d [1] 0.02647495
那麼基於正態近似的差異的 95% 置信區間為 (0.0070, 0.1107),$ 基本相同
P.w-P.m + qnorm(c(.025,.975))*SE.d [1] 0.006967198 0.110747087
在 R 中,程序
prop.test
給出相同的 95% 置信區間 $ (0.0070, 0.1107). $ [這個區間也是基於正態近似;由於樣本量大,連續性校正被拒絕。]prop.test(c(226,132), c(700,500), cor=F)$conf.int [1] 0.006967198 0.110747087 attr(,"conf.level") [1] 0.95
請注意,這個 95% 的置信區間不包括 $ 0. $ 因此,女性和男性意見相同的測試在 5% 的水平上被拒絕(反對雙邊選擇)。(近似正態)檢驗的 P 值為 $ 0.028 < 0.05 = 5%. $
prop.test(c(226,132), c(700,500), cor=F)$p.val [1] 0.02802182