格爾曼和魯賓收斂診斷，如何推廣到使用向量？

May 20, 2014

Gelman 和 Rubin 診斷用於檢查並行運行的多個 mcmc 鏈的收斂性。它將鏈內方差與鏈間方差進行比較，說明如下：

步驟（針對每個參數）：

從過度分散的起始值運行 m ≥ 2 個長度為 2n 的鏈。

丟棄每個鏈中的前 n 個抽籤。

計算鏈內和鏈間方差。

將參數的估計方差計算為鏈內和鏈間方差的加權和。

計算潛在的比例縮減因子。

項目清單

我想使用這個統計數據，但我想使用它的變量是隨機向量。

在這種情況下取協方差矩陣的平均值是否有意義？

建議：只需為每個標量分量分別計算 PSRF

Gelman & Rubin [1] 的原始文章，以及 Gelman 等人的貝葉斯數據分析教科書。[2] 建議為每個感興趣的標量參數分別計算潛在的比例縮減因子 (PSRF)。為了推斷收斂性，需要所有 PSRF 接近 1。將參數解釋為隨機向量並不重要，它們的分量是可以計算 PSRF 的標量。

Brooks & Gelman [3] 提出了 PSRF 的多變量擴展，我將在本答案的下一部分進行回顧。然而，引用 Gelman & Shirley [4] 的話：

[…] 這些方法有時可能顯得有些矯枉過正：即使多元分佈的模擬的近似收斂可能需要很長時間，也可以很好地估計單個參數。

替代方案：Brooks&Gelman 的多元擴展

Brooks & Gelman [3] 提出了 PSRF 的多元擴展，其中確實有人將估計的協方差矩陣（您的步驟 4）計算為鏈內的加權和（ $ W $ ) 和鏈間 ( $ B $ ）協方差矩陣（您的第 3 步）： $$ \begin{equation} \hat{V} = \frac{n-1}{n}W + \left ( 1 + \frac{1}{m} \right )\frac{B}{n}, \end{equation} $$ 在哪裡 $ n $ 是鍊長。然後，需要為協方差矩陣之間的距離定義一些標量度量 $ \hat{V},W $ . 作者提出 $$ \begin{equation} \hat{R} = \max_a \frac{a^T\hat{V}a}{a^TWa} = \frac{n-1}{n} + \left(\frac{m+1}{m}\right)\lambda_1, \end{equation} $$ 在哪裡 $ m $ 是鏈的數量，相等性在文章中顯示為 $ \lambda_1 $ 是最大的正特徵值 $ W^{-1}\hat{V}/n $ . 然後，作者認為在鏈的收斂下， $ \lambda_1\rightarrow 0 $ 因此大 $ n $ 這個多元 $ \hat{R} $ 應該在 1 附近收斂。

參考

[1] 格爾曼、安德魯和唐納德 B. 魯賓。“使用多個序列的迭代模擬推斷。” 統計科學（1992）：457-472。

[2] 格爾曼、安德魯等人。貝葉斯數據分析。CRC 出版社，2013 年。

[3] 布魯克斯、斯蒂芬 P. 和安德魯·格爾曼。“監測迭代模擬收斂的一般方法。” 計算和圖形統計雜誌 7.4 (1998): 434-455。

[4] 格爾曼、安德魯和肯尼斯·雪莉。“從模擬推斷和監測收斂”。（第 6 章，Brooks，Steve 等人，編著馬爾可夫鏈蒙特卡羅手冊。CRC 出版社，2011 年。）

除了教科書 [2] 之外的所有文章都可以在 Andrew Gelman 的網站Andrew Gelman 的網站上找到。

引用自：https://stats.stackexchange.com/questions/99375

comments powered by Disqus

格爾曼和魯賓收斂診斷，如何推廣到使用向量？

建議：只需為每個標量分量分別計算 PSRF

替代方案：Brooks&Gelman 的多元擴展

參考

相關問答

中心極限定理與一致性之間的差異

使用牛頓法優化 OLS

後驗何時收斂到點質量？

做什麼磷(|Xn-X|≥ε)磷(|Xn-X|≥ε)P(|X_n - X| geq epsilon)直觀地表示？

揭穿錯誤的 CLT 聲明

協方差矩陣和協方差矩陣的逆矩陣之間的幾何關係是什麼？