MCMC 算法中的錯誤示例
我正在研究一種自動檢查馬爾可夫鏈蒙特卡羅方法的方法,我想要一些在構建或實現此類算法時可能發生的錯誤示例。如果在已發表的論文中使用了不正確的方法,則可以加分。
我對錯誤意味著鏈具有不正確的不變分佈的情況特別感興趣,儘管其他類型的錯誤(例如鍊不是遍歷的)也會感興趣。
當 Metropolis-Hastings 拒絕提議的移動時,無法輸出值就是此類錯誤的一個示例。
1. 邊際似然和調和平均估計量
邊際似然定義為後驗分佈的歸一化常數
這個數量的重要性來自於它通過貝葉斯因子在模型比較中所起的作用。
已經提出了幾種近似該數量的方法。拉夫特里等人。(2007)提出了諧波均值估計器,由於其簡單性而迅速流行起來。這個想法包括使用關係
因此,如果我們有一個來自後驗的樣本,比如說, 這個量可以近似為
這種近似與重要性採樣的概念有關。
根據大數定律,正如 Neal 的博客中所討論的,我們有這個估計量是一致的。問題是所需的一個好的近似值可能很大。有關示例,請參閱 Neal 的博客或 Robert 的博客1、2、3、4。
備擇方案
有許多替代方法可以近似. Chopin 和 Robert (2008)提出了一些基於重要性採樣的方法。
2. 沒有足夠長的時間運行你的 MCMC 採樣器(特別是在多模態的情況下)
Mendoza 和 Gutierrez-Peña (1999)推導出了兩個正態均值比的參考先驗/後驗,並展示了使用真實數據集通過該模型獲得的推論示例。使用 MCMC 方法,他們獲得了一個大小為均值比的後驗如下所示
並獲得 HPD 間隔 . 分析後驗分佈的表達式,不難看出它在並且後部實際上應該看起來像這樣(注意奇點在)
僅當您運行 MCMC 採樣器足夠長的時間或使用自適應方法時才能檢測到。使用這些方法之一獲得的 HPD 是正如已經報導的那樣。HPD 間隔的長度顯著增加,這在與頻率論/經典方法比較時具有重要意義。
3. Gelman、Carlin 和 Neal的討論中可以找到其他一些問題,例如評估收斂性、起始值的選擇、鏈的不良行為。
4.重要性抽樣
近似積分的方法包括將被積函數乘以密度,在同樣的支持下,我們可以模擬
那麼,如果我們有一個樣本來自,, 我們可以近似如下
一個可能的問題是應該有比/到更重/相似的尾巴或所需的一個好的近似值可能是巨大的。請參閱 R 中的以下玩具示例。
# Integrating a Student's t with 1 d.f. using a normal importance function x1 = rnorm(10000000) # N=10,000,000 mean(dt(x1,df=1)/dnorm(x1)) # Now using a Student's t with 2 d.f. function x2 = rt(1000,df=2) mean(dt(x2,df=1)/dt(x2,df=2))