R
通過自舉估計標準差置信區間的奇怪模式
我想估計一些數據的標準偏差的置信區間。R 代碼如下所示:
library(boot) sd_boot <- function (x, ind) { res <- sd(x$ReadyChange[ind], na.rm = TRUE) return(res) } data_boot <- boot::boot(data, statistic = sd_boot, R = 10000) plot(data_boot)
我堅持正確解釋這個自舉直方圖。每隔一組類似的數據顯示引導估計的正態分佈……但不是這個。順便說一句,這是實際的原始數據:
> data$ReadyChange [1] 27.800000 8.985046 11.728021 8.830856 5.738600 12.028310 7.771528 9.208924 11.778611 6.024259 5.969931 6.063484 4.915764 [14] 12.027639 9.111146 13.898171 12.921377 6.916667 10.764479 6.875000 12.875000 7.017917 9.750000 7.921782 12.911551 6.000000
你能幫我解釋一下這個引導模式嗎?
您的代碼中可能有錯誤,或者引導庫做了一些超出預期的事情。
編輯:
提供校正數據後,很明顯該模式是由一個異常值引起的,每個峰對應於異常值被選入樣本的不同次數。