R

通過自舉估計標準差置信區間的奇怪模式

  • January 16, 2017

我想估計一些數據的標準偏差的置信區間。R 代碼如下所示:

library(boot)
sd_boot <- function (x, ind) {                
       res <- sd(x$ReadyChange[ind], na.rm = TRUE)
       return(res)            
}
data_boot <- boot::boot(data, statistic = sd_boot, R = 10000)
plot(data_boot)

我有下一個情節:在此處輸入圖像描述

我堅持正確解釋這個自舉直方圖。每隔一組類似的數據顯示引導估計的正態分佈……但不是這個。順便說一句,這是實際的原始數據:

> data$ReadyChange
[1] 27.800000  8.985046 11.728021  8.830856  5.738600 12.028310  7.771528  9.208924 11.778611  6.024259  5.969931  6.063484  4.915764
[14] 12.027639  9.111146 13.898171 12.921377  6.916667 10.764479  6.875000 12.875000  7.017917  9.750000  7.921782 12.911551  6.000000

你能幫我解釋一下這個引導模式嗎?

您的代碼中可能有錯誤,或者引導庫做了一些超出預期的事情。

編輯:

提供校正數據後,很明顯該模式是由一個異常值引起的,每個峰對應於異常值被選入樣本的不同次數。

在此處輸入圖像描述

引用自:https://stats.stackexchange.com/questions/256505

comments powered by Disqus