Confidence-Interval
如何計算非正態分佈樣本中平均值的置信區間?
如何計算非正態分佈樣本中平均值的置信區間?
我知道這裡常用引導方法,但我對其他選項持開放態度。雖然我正在尋找一個非參數選項,但如果有人可以說服我參數解決方案是有效的,那很好。樣本量 > 400。
如果有人可以在 R 中提供樣本,將不勝感激。
首先,我會檢查平均值是否適合手頭的任務。如果您正在尋找偏態分佈的“典型/或中心值”,則平均值可能會指向一個相當不具代表性的值。考慮對數正態分佈:
x <- rlnorm(1000) plot(density(x), xlim=c(0, 10)) abline(v=mean(x), col="red") abline(v=mean(x, tr=.20), col="darkgreen") abline(v=median(x), col="blue")
平均值(紅線)與大部分數據相距甚遠。20% 的修剪平均值(綠色)和中位數(藍色)更接近“典型”值。
結果取決於“非正態”分佈的類型(實際數據的直方圖會有所幫助)。如果它沒有歪斜,但尾巴很重,那麼您的 CI 將非常寬。
無論如何,我認為引導確實是一個好方法,因為它也可以給你不對稱的 CI。該
R
軟件包simpleboot
是一個好的開始:library(simpleboot) # 20% trimmed mean bootstrap b1 <- one.boot(x, mean, R=2000, tr=.2) boot.ci(b1, type=c("perc", "bca"))
…給你以下結果:
# The bootstrap trimmed mean: > b1$t0 [1] 1.144648 BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS Based on 2000 bootstrap replicates Intervals : Level Percentile BCa 95% ( 1.062, 1.228 ) ( 1.065, 1.229 ) Calculations and Intervals on Original Scale