Bootstrap
子樣本自舉
我一直在研究與從蒙特卡洛項目計算的數量相關的不確定性。通常我會通過替換重採樣來使用引導方法,因為一些技術原因在這裡並不是特別容易。有人建議我只是分解我的 MC 數據集並使用這些子集進行實驗並以這種方式找到不確定性。我過去曾遇到過僅使用原始數據集的一個子集進行引導的參考。
有人可以向我指出有關此的教程或簡要解釋與替換引導和僅將樣本數量設置為總大小的一小部分的不同之處。我會對一種方法特別感興趣,這意味著每個子樣本可能不同,這將使我的分析更加簡單。
有兩種方法與您的問題相關。一個是 n 個 bootstrap 中的 m 個,另一個是隨機子採樣。在他最初的提議中,Efron 選擇了與原始樣本大小相同的 bootstrap 樣本大小。這樣做沒有具體要求,但其想法是盡可能地模仿人群中的隨機抽樣。但是,在某些情況下,這種普通的引導程序是不一致的。Bickel 和 Ren 等人表明,採用較小的樣本量 m 可以產生一致的結果。這在 m 和 n 都趨於無窮大但速度使 m/n 趨於 0 時漸近地起作用。隨機二次抽樣是在 1960 年代後期由 Hartigan 和 McCarthy 引入的,大約比 bootstrap 早了十年。它使用隨機抽樣原始樣本子集的過程。
有關 m out of n bootstrap 的信息,您可以查閱我撰寫/合著的以下任一書籍:
Politis、Romano 和 Wolf 的這本書非常詳細地介紹了隨機二次抽樣: