Sampling

引導樣本與原始樣本完全相同的機會

  • January 23, 2017

只是想檢查一些推理。

如果我的原始樣本大小我引導它,然後我的思考過程如下:

是從原始樣本中獲得任何觀察結果的機會。為了確保下一次抽籤不是之前採樣的觀察,我們將樣本大小限制為. 因此,我們得到了這個模式:

這個對嗎?我偶然發現為什麼不能反而。

請注意,在每個觀察位置 () 我們可以選擇任何觀察,所以有可能的重新採樣(保持它們被繪製的順序)其中是“相同的樣本”(即包含所有沒有重複的原始觀察;這說明了我們開始訂購樣品的所有方式)。

例如,對於三個觀察值 a、b 和 c,您有 27 個可能的樣本:

aaa aab aac aba abb abc aca acb acc 
baa bab bac bba bbb bbc bca bcb bcc 
caa cab cac cba cbb cbc cca ccb ccc 

其中六個包含 a、b 和 c 各一個。

所以是獲取原始樣本的概率。

撇開 - 概率的快速近似:

考慮一下

所以

下限是斯特林近似的常用下限(對於大)。

[Gosper建議使用這將產生近似值對於這個概率,它可以合理地很好地下降到,甚至下降到取決於您的標準有多嚴格。]


(對評論的回應:)在給定的重新採樣中沒有得到特定觀察的概率是這對於大大約是.

有關詳細信息,請參閱

為什麼每個 bootstrap 樣本平均包含大約三分之二的觀察值?

引用自:https://stats.stackexchange.com/questions/257637

comments powered by Disqus