Probability

在貝葉斯統計中,數據被認為是非隨機的,但可以有概率或有條件。如何?

  • June 9, 2021

在貝葉斯統計中,參數被稱為隨機變量,而數據被稱為非隨機變量。然而,如果我們看一下貝葉斯更新公式 $$ p(\theta|y)=\frac{p(\theta)p(y|\theta)}{p(y)}, $$ 我們發現概率(密度或質量)取決於數據以及數據本身的條件和無條件概率(密度或質量)。

考慮以常數或常數的概率(密度或質量)為條件的概率(密度或質量)有何意義?

(參數)統計推斷的貝葉斯方法從統計模型開始,即一系列參數化分佈, $$ X\sim F_\theta,\qquad\theta\in\Theta $$ 它在參數上引入了一個補充概率分佈 $$ \theta\sim\pi(\theta) $$ 後驗分佈 $ \theta $ 因此被定義為條件分佈 $ \theta $ 有條件的 $ X=x $ ,觀察到的數據。這種構造顯然依賴於假設數據是具有明確分佈的隨機變量的實現。否則就不可能定義像後驗這樣的條件分佈,因為沒有隨機變量可以作為條件。

可能的混淆可能源於這樣一個事實,即貝葉斯方法和常客方法之間的區別在於常客程序是根據它們的頻率屬性進行評估和比較的,即通過對所有可能的實現進行平均,而不是像貝葉斯方法那樣以實際實現為條件做。例如,程序的頻率風險 $ \delta $ 對於損失函數 $ L(\theta,d) $ 是 $$ R(\theta,\delta) = \mathbb E_\theta[L(\theta,\delta(X))] $$ 而貝葉斯後驗損失程序 $ \delta $ 為先 $ \pi $ 是 $$ \rho(\delta(x),\pi) = \mathbb E^\pi[L(\theta,\delta(x))|X=x] $$

引用自:https://stats.stackexchange.com/questions/529961

comments powered by Disqus