通過自舉估計標準差置信區間的奇怪模式

January 16, 2017

我想估計一些數據的標準偏差的置信區間。R 代碼如下所示：
library(boot)
sd_boot <- function (x, ind) {                
       res <- sd(x$ReadyChange[ind], na.rm = TRUE)
       return(res)            
}
data_boot <- boot::boot(data, statistic = sd_boot, R = 10000)
plot(data_boot)
我有下一個情節：

我堅持正確解釋這個自舉直方圖。每隔一組類似的數據顯示引導估計的正態分佈……但不是這個。順便說一句，這是實際的原始數據：
> data$ReadyChange
[1] 27.800000  8.985046 11.728021  8.830856  5.738600 12.028310  7.771528  9.208924 11.778611  6.024259  5.969931  6.063484  4.915764
[14] 12.027639  9.111146 13.898171 12.921377  6.916667 10.764479  6.875000 12.875000  7.017917  9.750000  7.921782 12.911551  6.000000
你能幫我解釋一下這個引導模式嗎？

您的代碼中可能有錯誤，或者引導庫做了一些超出預期的事情。

編輯：

提供校正數據後，很明顯該模式是由一個異常值引起的，每個峰對應於異常值被選入樣本的不同次數。

引用自：https://stats.stackexchange.com/questions/256505

comments powered by Disqus

通過自舉估計標準差置信區間的奇怪模式

相關問答

當您擁有全部人口時，是否適合在數據上放置“誤差線”？

關於文章“拋棄 p 值。改用 Bootstrap 置信區間”的三個問題

估計參數函數周圍的置信區間

計算兩個獨立比例之差的標準誤

Westfall 說，“峰度的比例由中央決定μ±σμ±σmupmsigma範圍通常很小”但反過來是真的嗎？

如何從二元邏輯回歸模型中獲得兩個概率之間差異的置信區間？