Confidence-Interval

如何計算非正態分佈樣本中平均值的置信區間?

  • October 5, 2011

如何計算非正態分佈樣本中平均值的置信區間?

我知道這裡常用引導方法,但我對其他選項持開放態度。雖然我正在尋找一個非參數選項,但如果有人可以說服我參數解決方案是有效的,那很好。樣本量 > 400。

如果有人可以在 R 中提供樣本,將不勝感激。

首先,我會檢查平均值是否適合手頭的任務。如果您正在尋找偏態分佈的“典型/或中心值”,則平均值可能會指向一個相當不具代表性的值。考慮對數正態分佈:

x <- rlnorm(1000)
plot(density(x), xlim=c(0, 10))
abline(v=mean(x), col="red")
abline(v=mean(x, tr=.20), col="darkgreen")
abline(v=median(x), col="blue")

對數正態分佈的均值(紅色)、20% 修剪均值(綠色)和中值(藍色)

平均值(紅線)與大部分數據相距甚遠。20% 的修剪平均值(綠色)和中位數(藍色)更接近“典型”值。

結果取決於“非正態”分佈的類型(實際數據的直方圖會有所幫助)。如果它沒有歪斜,但尾巴很重,那麼您的 CI 將非常寬。

無論如何,我認為引導確實是一個好方法,因為它也可以給你不對稱的 CI。該R軟件包simpleboot是一個好的開始:

library(simpleboot)
# 20% trimmed mean bootstrap
b1 <- one.boot(x, mean, R=2000, tr=.2)
boot.ci(b1, type=c("perc", "bca"))

…給你以下結果:

# The bootstrap trimmed mean:
> b1$t0
[1] 1.144648

BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 2000 bootstrap replicates
Intervals : 
Level     Percentile            BCa          
95%   ( 1.062,  1.228 )   ( 1.065,  1.229 )  
Calculations and Intervals on Original Scale

引用自:https://stats.stackexchange.com/questions/16516

comments powered by Disqus