Bootstrap

為什麼使用參數引導程序?

  • May 8, 2014

我目前正試圖了解有關參數引導的一些事情。大多數事情可能都是微不足道的,但我仍然認為我可能錯過了一些東西。

假設我想使用參數引導程序獲取數據的置信區間。

所以我有這個樣本,我假設它是正態分佈的。然後我會估計方差和意思並得到我的分佈估計,這顯然只是.

而不是從該分佈中採樣,我可以只分析計算分位數並完成。

a)我得出結論:在這種微不足道的情況下,參數引導程序與在正態分佈假設中計算事物相同嗎?

所以理論上這對於所有參數引導模型都是如此,只要我能處理計算。

b)我得出結論:使用某個分佈的假設將為我在參數引導程序中帶來比非參數引導程序更高的準確性(當然,如果它是正確的)。但除此之外,我這樣做只是因為我無法處理分析計算並試圖模擬我的出路?

c)如果計算“通常”使用某種近似值完成,我也會使用它,因為這可能會給我更高的準確性……?

對我來說,(非參數)引導的好處似乎在於我不需要假設任何分佈。對於參數引導程序,優勢消失了 - 還是我錯過了一些東西,參數引導程序在哪些方面提供了優於上述內容的好處?

是的。你說的對。但是當假設成立時,參數引導程序會屏蔽更好的結果。這樣想:

我們有一個隨機樣本從分佈. 我們估計一個感興趣的參數作為樣本的函數,. 這個估計是一個隨機變量,所以它有一個分佈,我們稱之為. 這種分佈完全由和 意義. 在進行任何類型的引導(參數、非參數、重新採樣)時,我們所做的是估計和為了得到一個估計,. 從我們估計的屬性. 不同類型的引導程序的變化是我們如何得到.

如果你能分析計算你應該去做,但總的來說,這是一件相當困難的事情。bootstrap 的神奇之處在於我們可以生成具有分佈的樣本. 為此,我們生成隨機樣本 帶分佈併計算這將遵循分配。

這樣一想,參數引導的優勢就很明顯了。將是更好的近似值, 然後會更接近最後的估計的屬性會更好。

引用自:https://stats.stackexchange.com/questions/96900

comments powered by Disqus