Sample-Size

馬爾可夫鏈蒙特卡羅樣本數

  • March 23, 2016

很多關於馬爾可夫鏈蒙特卡羅 (MCMC) 收斂診斷的文獻,包括最流行的 Gelman-Rubin 診斷。然而,所有這些都評估了馬爾可夫鏈的收斂性,從而解決了老化問題。

一旦我弄清楚老化,我應該如何確定有多少 MCMC 樣本足以繼續我的估計過程?大多數使用 MCMC 的論文都提到他們運行馬爾可夫鏈一段時間迭代,但不要說他們為什麼/如何選擇這個數字,.

此外,一個期望的樣本量不能是所有採樣器的答案,因為馬爾可夫鏈中的相關性因問題而異。那麼是否有一個規則可以找出所需的樣本數量?

您需要多少樣品(老化後)取決於您嘗試對這些樣品做什麼以及您的鏈條如何混合。

通常我們對後驗期望(或分位數)感興趣,我們通過後驗樣本的平均值來近似這些期望,即

在哪裡是來自您的 MCMC 的樣本。根據大數定律,MCMC 估計幾乎肯定會收斂到期望的期望。 但是為了解決需要多少樣本來確保我們足夠接近預期期望的問題,我們需要一個中心極限定理 (CLT) 結果,即類似於

有了這個 CLT,我們就可以做出概率性陳述,例如“有 95% 的概率在。。。之間。”這裡的兩個問題是

  1. CLT 適用嗎?
  2. 我們如何估計.

我們有一些關於何時應用 CLT 的結果,例如離散狀態鏈、可逆鏈、幾何遍歷鏈。有關此方向的一些結果,請參見Robert 和 Casella(第 2 版)第 6.7.2 節。不幸的是,絕大多數馬爾可夫鏈都沒有證據證明 CLT 存在。

如果 CLT 確實存在,我們仍然需要估計 CLT 中的方差。估計這種差異的一種方法是將鏈分解成塊,請參閱Gong 和 Flegal以及其中的參考資料。該方法已在mcmcse具有函數的 R 包中實現,mcsemcse.q用於估計期望和分位數的方差。

引用自:https://stats.stackexchange.com/questions/203281

comments powered by Disqus