基於 Bootstrap 的置信區間

December 4, 2011

在研究基於引導的置信區間時，我曾經讀過以下語句：

如果 bootstrap 分佈向右傾斜，則基於 bootstrap 的置信區間包含一個校正，以將端點向右移動更遠；這似乎違反直覺，但這是正確的做法。

我試圖理解上述陳述背後的邏輯。

這個問題與置信區間的基本構造有關，當涉及到自舉時，答案取決於所使用的自舉方法。

考慮以下設置：是實值參數的估計量有（估計的）標準偏差，然後是基於正常值的標準 95% 置信區間近似是

該置信區間導出為滿足

在哪裡是 2.5% 的分位數和是 97.5% 的分位數-分配。有趣的觀察是，當重新排列不等式時，我們得到的置信區間表示為

也就是說，下2.5% 分位數決定右端點，上97.5% 分位數決定左端點。如果抽樣分佈與正常近似值相比是右偏斜的，那麼適當的動作是什麼？如果右偏意味著抽樣分佈的 97.5% 分位數是，適當的動作是將左端點進一步向左移動。也就是說，如果我們堅持上面的標準結構。bootstrap 的標準用法是估計採樣分位數，然後使用它們而不是在上面的構造中。

然而，bootstrapping 中使用的另一種標準結構是百分位數區間，即

在上面的術語中。它只是從 2.5% 分位數到 97.5% 分位數的區間，用於樣本分佈右偏抽樣分佈意味著右偏置信區間。由於上述原因，在我看來，這似乎是百分位區間的反直覺行為。但它們還有其他優點，例如，在單調參數變換下是不變的。由 Efron 介紹的 BCa（偏差校正和加速）引導區間，參見例如論文Bootstrap Confidence Intervals，改進了百分位區間的屬性。我只能猜測（和谷歌）OP 帖子的引用，但也許 BCa 是合適的上下文。從第 193 頁提到的論文中引用 Dicccio 和 Efron，

以下論點激發了 BCa 定義 (2.3) 以及參數和. 假設存在單調遞增變換這樣正態分佈於每一個選擇，但可能帶有偏差和非常量方差，

那麼 (2.3) 給出了準確且正確的置信限觀察到.

其中 (2.3) 是 BCa 區間的定義。OP 發布的報價可能指的是 BCa 可以將具有右偏抽樣分佈的置信區間進一步向右移動。很難判斷這是否是一般意義上的“正確操作”，但根據 Dicccio 和 Efron 的說法，在生成具有正確覆蓋率的置信區間的意義上，它在上述設置中是正確的。單調變換的存在不過，這有點棘手。

引用自：https://stats.stackexchange.com/questions/19340

comments powered by Disqus

基於 Bootstrap 的置信區間

相關問答

關於文章“拋棄 p 值。改用 Bootstrap 置信區間”的三個問題

隨機森林是否擅長檢測交互項？

為什麼不以以下方式進行引導？

自舉回歸分析後，所有 p 值都是 0.001996 的倍數

為什麼jackknife的計算量比bootstrap少？

什麼時候可以將引導程序應用於時間序列模型？