Sampling

自舉樣本的大小

  • November 18, 2016

我正在學習自舉作為估計樣本統計量方差的一種方法。我有一個基本的疑問。

引用http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf

• 我們應該重新採樣多少個觀測值?一個好的建議是原始樣本量。

我們如何重新採樣與原始樣本一樣多的觀測值?

如果我的樣本量為 100,並且我正在嘗試估計均值的方差。如何從總樣本量 100 中獲得多個大小為 100 的引導樣本?在這種情況下,只有 1 個引導樣本可能等同於原始樣本,對嗎?

我顯然誤解了一些非常基本的東西。我知道理想的引導樣本的數量總是無限的,為了確定我的數據所需的引導樣本的數量,我必須測試收斂性,同時牢記我所需的精度。 但是我真的很困惑每個單獨的引導樣本的大小應該是多少。

Bootstrap 是通過有放回抽樣來進行的。您似乎不清楚“替換”一詞。正如whuber所指出的,帶放回抽樣的說明在第 10 頁給出。您參考的論文中的 3 篇(轉載如下)。

帶放回抽樣的圖解

(來源:http ://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf )

帶放回抽樣的一般思想是任何情況都可以多次抽樣*(上面第一張圖片上的綠色大理石;最後一張圖片上的藍色和紫色大理石)。如果你想自己想像這個過程,想像一個裝滿彩色大理石的碗。假設您想從這個碗中抽取一些彈珠。如果您在沒有更換的情況下進行採樣,那麼您只需將彈珠從碗中取出並將採樣的彈珠放在一邊。如果您替換取樣,那麼您將一個接一個地取樣大理石,從碗中取出單個大理石,在筆記本上簽下它的顏色,然後將其退回*到碗裡。因此,在更換取樣時,可以對同一大理石進行多次取樣。

所以在更換採樣時,可以只採樣從碗裡拿出彈珠彈珠,而在更換採樣的情況下,可以採樣任意數量的彈珠(甚至更多) 來自有限人口。如果你抽樣在……之外如果沒有更換彈珠,您最終會得到完全相同的樣品,但順序是打亂的。如果你抽樣在……之外替換的彈珠,每次您都可以取樣不同的彈珠組合。

無需更換的採樣方式超出人口規模的病例和替換抽樣的方法。如果你想了解更多關於它背後的數學知識,你可以查看2.1. Hossein Pishro-Nik 在線概率導論手冊的組合學章節。WolframMathWorld頁面上還有一個方便的備忘單。

引用自:https://stats.stackexchange.com/questions/246726

comments powered by Disqus