Bootstrap
關於不確定性的引導估計的假設
我很欣賞 bootstrap 在獲得不確定性估計方面的有用性,但一直困擾我的一件事是,與這些估計相對應的分佈是樣本定義的分佈。一般來說,認為我們的樣本頻率看起來與基礎分佈完全一樣似乎是個壞主意,那麼為什麼根據樣本頻率定義基礎分佈的分佈來推導不確定性估計是合理/可接受的呢?
另一方面,這可能並不比我們通常做出的其他分佈假設更差(可能更好),但我仍然想更好地理解理由。
可以想像,有幾種方法可以應用引導程序。兩種最基本的方法被認為是“非參數”和“參數”引導程序。第二個假設您使用的模型(基本上)是正確的。
讓我們專注於第一個。我們假設您有一個隨機樣本根據分佈函數分佈. (假設否則需要修改方法。)讓是經驗累積分佈函數。引導程序的大部分動機來自幾個事實。
Dvoretzky-Kiefer-Wolfowitz 不等式
這表明經驗分佈函數在概率上以指數速度**均勻收斂到真實分佈函數。事實上,這種不等式與 Borel-Cantelli 引理相結合立即表明幾乎可以肯定。
表格沒有附加條件以保證這種收斂。
那麼,啟發式地,如果我們對某些函數感興趣的分佈函數是平滑的,那麼我們期望靠近.
(逐點)的無偏性
通過期望的簡單線性和定義, 對於每個,
假設我們對均值感興趣. 然後經驗測度的無偏性擴展到經驗測度的線性泛函的無偏性。所以,
所以平均而言是正確的,因為正在迅速接近,然後(啟發式地),迅速接近.
為了構建置信區間(本質上就是引導程序的全部內容),我們可以使用中心極限定理、經驗分位數的一致性和 delta 方法作為工具,從簡單的線性泛函轉向更複雜的感興趣的統計數據.
好的參考是
- B. Efron,Bootstrap 方法:再看一下折刀,Ann。統計。, 卷。7,沒有。1,1-26。
- B. Efron 和 R. Tibshirani,Bootstrap 簡介,Chapman-Hall,1994 年。
- GA Young 和 RL Smith,《統計推斷要點》,劍橋大學出版社,2005 年,第 11 章。
- AW van der Vaart,漸近統計,劍橋大學出版社,1998 年,第 23 章。
- P. Bickel 和 D. Freedman,引導程序的一些漸近理論。安。統計。, 卷。9,沒有。6 (1981), 1196–1217。