格爾曼和魯賓收斂診斷,如何推廣到使用向量?
Gelman 和 Rubin 診斷用於檢查並行運行的多個 mcmc 鏈的收斂性。它將鏈內方差與鏈間方差進行比較,說明如下:
步驟(針對每個參數):
- 從過度分散的起始值運行 m ≥ 2 個長度為 2n 的鏈。
- 丟棄每個鏈中的前 n 個抽籤。
- 計算鏈內和鏈間方差。
- 將參數的估計方差計算為鏈內和鏈間方差的加權和。
- 計算潛在的比例縮減因子。
- 項目清單
我想使用這個統計數據,但我想使用它的變量是隨機向量。
在這種情況下取協方差矩陣的平均值是否有意義?
建議:只需為每個標量分量分別計算 PSRF
Gelman & Rubin [1] 的原始文章,以及 Gelman 等人的貝葉斯數據分析教科書。[2] 建議為每個感興趣的標量參數分別計算潛在的比例縮減因子 (PSRF)。為了推斷收斂性,需要所有 PSRF 接近 1。將參數解釋為隨機向量並不重要,它們的分量是可以計算 PSRF 的標量。
Brooks & Gelman [3] 提出了 PSRF 的多變量擴展,我將在本答案的下一部分進行回顧。然而,引用 Gelman & Shirley [4] 的話:
[…] 這些方法有時可能顯得有些矯枉過正:即使多元分佈的模擬的近似收斂可能需要很長時間,也可以很好地估計單個參數。
替代方案:Brooks&Gelman 的多元擴展
Brooks & Gelman [3] 提出了 PSRF 的多元擴展,其中確實有人將估計的協方差矩陣(您的步驟 4)計算為鏈內的加權和( $ W $ ) 和鏈間 ( $ B $ )協方差矩陣(您的第 3 步): $$ \begin{equation} \hat{V} = \frac{n-1}{n}W + \left ( 1 + \frac{1}{m} \right )\frac{B}{n}, \end{equation} $$ 在哪裡 $ n $ 是鍊長。然後,需要為協方差矩陣之間的距離定義一些標量度量 $ \hat{V},W $ . 作者提出 $$ \begin{equation} \hat{R} = \max_a \frac{a^T\hat{V}a}{a^TWa} = \frac{n-1}{n} + \left(\frac{m+1}{m}\right)\lambda_1, \end{equation} $$ 在哪裡 $ m $ 是鏈的數量,相等性在文章中顯示為 $ \lambda_1 $ 是最大的正特徵值 $ W^{-1}\hat{V}/n $ . 然後,作者認為在鏈的收斂下, $ \lambda_1\rightarrow 0 $ 因此大 $ n $ 這個多元 $ \hat{R} $ 應該在 1 附近收斂。
參考
[1] 格爾曼、安德魯和唐納德 B. 魯賓。“使用多個序列的迭代模擬推斷。” 統計科學(1992):457-472。
[2] 格爾曼、安德魯等人。貝葉斯數據分析。CRC 出版社,2013 年。
[3] 布魯克斯、斯蒂芬 P. 和安德魯·格爾曼。“監測迭代模擬收斂的一般方法。” 計算和圖形統計雜誌 7.4 (1998): 434-455。
[4] 格爾曼、安德魯和肯尼斯·雪莉。“從模擬推斷和監測收斂”。(第 6 章,Brooks,Steve 等人,編著馬爾可夫鏈蒙特卡羅手冊。CRC 出版社,2011 年。)
除了教科書 [2] 之外的所有文章都可以在 Andrew Gelman 的網站Andrew Gelman 的網站上找到。