Markov-Chain-Montecarlo
使用 Metropolis-Hastings 算法的 MCMC:選擇提案
我需要做一個模擬來評估一個 3 參數函數的積分,我們說,它有一個非常複雜的公式。要求使用 MCMC 方法對其進行計算並實現 Metropolis-Hastings 算法以生成分佈為,並且建議使用 3 變量正態作為提案分佈。閱讀一些關於它的例子,我看到其中一些使用帶有固定參數的法線和一些使用可變均值, 在哪裡是根據分佈的最後一個接受的值. 我對這兩種方法都有一些疑問:
**1)**選擇最後一個接受的值作為我們提案分佈的新均值是什麼意思?我的直覺說它應該保證我們的價值觀將更接近於分佈為並且接受的機會會更大。但它不是過於集中我們的樣本嗎?可以保證,如果我獲得更多樣本,鏈條將變得靜止?
**2)**不會選擇固定參數(因為真的很難分析)真的很難並且依賴於我們需要選擇的第一個樣本來啟動算法?在這種情況下,找出哪個更好的最佳方法是什麼?
這些方法中的一種是否比另一種更好,或者這取決於具體情況?
我希望我的疑慮很清楚,如果可以提供一些文獻我會很高興(我讀過一些關於這個主題的論文,但越多越好!)
提前致謝!
1)您可以將此方法視為隨機遊走方法。當提案分發,通常稱為 Metropolis 算法。如果太小,你會有很高的接受率,並且非常緩慢地探索目標分佈。事實上,如果太小並且分佈是多模態的,採樣器可能會卡在特定的模式中,無法充分探索目標分佈。另一方面,如果太大,錄取率就會太低。由於您具有三個維度,因此您的提案分佈將具有協方差矩陣這可能需要每個維度的不同方差和協方差。選擇合適的可能很難。
- 如果你的提案分佈總是,那麼這是獨立的 Metropolis-Hastings 算法,因為您的提案分佈不依賴於您當前的樣本。如果您的提案分佈是您希望從中採樣的目標分佈的良好近似值,則此方法效果最佳。您是正確的,選擇一個好的正態近似可能很困難。
這兩種方法的成功都不應取決於採樣器的起始值。無論你從哪裡開始,馬爾可夫鏈最終都應該收斂到目標分佈。要檢查收斂,您可以從不同的起點運行多個鏈並執行收斂診斷,例如 Gelman-Rubin 收斂診斷。