基於 Bootstrap 的置信區間
在研究基於引導的置信區間時,我曾經讀過以下語句:
如果 bootstrap 分佈向右傾斜,則基於 bootstrap 的置信區間包含一個校正,以將端點向右移動更遠;這似乎違反直覺,但這是正確的做法。
我試圖理解上述陳述背後的邏輯。
這個問題與置信區間的基本構造有關,當涉及到自舉時,答案取決於所使用的自舉方法。
考慮以下設置:是實值參數的估計量有(估計的)標準偏差,然後是基於正常值的標準 95% 置信區間近似是
該置信區間導出為滿足
在哪裡是 2.5% 的分位數和是 97.5% 的分位數-分配。有趣的觀察是,當重新排列不等式時,我們得到的置信區間表示為
也就是說,下2.5% 分位數決定右端點,上97.5% 分位數決定左端點。 如果抽樣分佈與正常近似值相比是右偏斜的,那麼適當的動作是什麼?如果右偏意味著抽樣分佈的 97.5% 分位數是,適當的動作是將左端點進一步向左移動。也就是說,如果我們堅持上面的標準結構。bootstrap 的標準用法是估計採樣分位數,然後使用它們而不是在上面的構造中。
然而,bootstrapping 中使用的另一種標準結構是百分位數區間,即
在上面的術語中。它只是從 2.5% 分位數到 97.5% 分位數的區間,用於樣本分佈右偏抽樣分佈意味著右偏置信區間。由於上述原因,在我看來,這似乎是百分位區間的反直覺行為。但它們還有其他優點,例如,在單調參數變換下是不變的。 由 Efron 介紹的 BCa(偏差校正和加速)引導區間,參見例如論文Bootstrap Confidence Intervals,改進了百分位區間的屬性。我只能猜測(和谷歌)OP 帖子的引用,但也許 BCa 是合適的上下文。從第 193 頁提到的論文中引用 Dicccio 和 Efron,
以下論點激發了 BCa 定義 (2.3) 以及參數和. 假設存在單調遞增變換這樣 正態分佈於每一個選擇,但可能帶有偏差和非常量方差,
那麼 (2.3) 給出了準確且正確的置信限觀察到.
其中 (2.3) 是 BCa 區間的定義。OP 發布的報價可能指的是 BCa 可以將具有右偏抽樣分佈的置信區間進一步向右移動。很難判斷這是否是一般意義上的“正確操作”,但根據 Dicccio 和 Efron 的說法,在生成具有正確覆蓋率的置信區間的意義上,它在上述設置中是正確的。單調變換的存在不過,這有點棘手。