Bootstrap

Bootstrap vs Monte Carlo,誤差估計

  • September 7, 2016

我正在閱讀安德森(Anderson)(1976 年)在地球化學計算中通過蒙特卡洛方法傳播誤差的文章,其中有些內容我不太了解。

考慮一些測量數據以及處理它並返回給定值的程序。在本文中,該程序用於首先使用數據的手段獲得最佳值(即:).

然後,作者使用蒙特卡羅方法通過在其不確定性限制內改變輸入參數(由具有均值的高斯分佈給出)來為該最佳值分配不確定性和標準差) 在將它們輸入程序之前。如下圖所示:

在此處輸入圖像描述

版權:ScienceDirect

其中不確定性可以從最終獲得分配。

如果我應用引導方法而不是這種蒙特卡羅方法,會發生什麼?像這樣的東西:

在此處輸入圖像描述

這是:在將數據輸入程序之前,我沒有在不確定性範圍內改變數據,而是從它們中進行替換。

在這種情況下,這兩種方法有什麼區別?在應用其中任何一個之前,我應該注意哪些警告?


我知道這個問題Bootstrap, Monte Carlo,但它並不能完全解決我的疑問,因為在這種情況下,數據包含指定的不確定性。

據我了解您的問題,“蒙特卡洛”方法和引導方法之間的區別本質上是參數統計和非參數統計之間的區別。

在參數化框架中,人們確切地知道數據如何生成,即給定模型的參數 (,, 等等。在您的描述中),您可以生成此類數據集的新實現,並從中生成您的統計程序(或“輸出”)的新實現。因此可以完整準確地描述輸出的概率分佈,通過數學推導或通過蒙特卡洛實驗從該分佈返回任意大小的樣本。

在非參數框架中,不希望對數據做出這樣的假設,因此使用數據並且僅使用數據來估計其分佈,. bootstrap 是一種通過經驗分佈估計未知分佈的方法通過設置概率權重在樣本的每個點上(在最簡單的情況下,當數據是 iid 時)。使用這種經驗分佈作為真實分佈的替代品,可以通過蒙特卡羅模擬推導出輸出的估計分佈.

因此,這兩種方法之間的主要區別在於是否對數據的分佈做出了這種參數化假設。

引用自:https://stats.stackexchange.com/questions/233804

comments powered by Disqus