作為可能性預期的後驗預測分佈
假設我們有一個後驗預測密度:
$$ p(\tilde{y}|\mathbf{y}) = \int p(\tilde{y}|\theta)p(\theta|\mathbf{y})d\theta $$
在霍夫的貝葉斯統計方法文本中,他建議獲得一個近似值 $ p(\tilde{y}|\mathbf{y}) $ 通過從後驗分佈中採樣,併計算 $ \frac{1}{S}\sum_{s=1}^Sp(\tilde{y}|\theta^{(s)}) $ .
他通過陳述來證明這一點 $ p(\tilde{y} | \mathbf{y}) $ 是後驗期望 $ p(\tilde{y}|\theta) $ ,但我實際上看不到等價物。一個如何得出 $ p(\tilde{y} | \mathbf{y}) $ 從 $ p(\tilde{y}|\theta) $ ?
$ \newcommand{\y}{\mathbf y} $ 我們有 $$ E_{\theta|\y}\left[f(\theta)\right] = \int f(\theta) p(\theta | \y),\text d\theta $$ 僅根據期望的定義(您也可以引用LOTUS),並且由於 $ p(\theta|\y) $ 是後驗密度這是後驗期望 $ f(\theta) $ . 現在選擇 $$ f(\theta) = p(\tilde y | \theta) $$ 然後 $$ E_{\theta|\y}\left[p(\tilde y | \theta)\right] = \int p(\tilde y | \theta) p(\theta | \y),\text d\theta. $$
我不確定你是否也想知道這個積分的理由,但通常假設數據是獨立的,給定生成參數,所以對於一個新點 $ \tilde y $ 你會有 $ \tilde y \perp \y | \theta $ 意思是 $$ p(\tilde y | \y) = \int p(\tilde y , \theta | \y),\text d\theta \ = \int p(\tilde y | \theta , \y) p(\theta | \y),\text d\theta \ = \int p(\tilde y | \theta) p(\theta | \y),\text d\theta \ = E_{\theta|\y}\left[p(\tilde y | \theta)\right] $$
所以你可以使用大數定律和後驗樣本來產生這個密度的估計量。