為什麼不使用貝葉斯定理的形式p(θ|x)=L(θ|x)p(θ)p(x)p(θ|X)=大號(θ|X)p(θ)p(X)p(theta | x) = frac{L(theta | x) p(theta)}{p(x)}?
在連續情況下,關於貝葉斯公式的一些歧義有很多問題(像這樣)。
$$ p(\theta | x) = \frac{p(x | \theta) \cdot p(\theta)}{p(x)} $$
通常,混淆源於條件分佈的定義 $ f(variable | parameter) $ 被解釋為 $ f $ 作為函數 $ variable $ 給定固定 $ parameter $ .
除此之外,還有一個等價原則,表明可能性可以寫成: $$ L(\theta | x) = p(x | \theta) $$
那麼為什麼不對以下形式的分佈使用貝葉斯規則:
$$ p(\theta | x) = \frac{L(\theta | x) \cdot p(\theta)}{p(x)} $$
強調我們正在處理的功能 $ \theta $ 給定觀察數據 $ x $ ,並且相應的術語是可能性(至少,從 $ L $ )?
這是一個傳統問題,還是在這種做法中有更基本的東西?
貝葉斯定理中有兩個基本的概率結果。一種是重寫聯合概率密度函數的方法:
$$ p(x,,y)=p(x,|,y)p(y). $$
另一個是計算條件概率密度函數的公式:
$$ p(y,|,x)=\frac{p(x,,y)}{p(x)}. $$
貝葉斯定理只是將這兩件事縫合在一起:
$$ p(\theta,|,x)=\frac{p(x,,\theta)}{p(x)}=\frac{p(x,|,\theta)p(\theta)}{p(x)} $$
所以這兩個數據 $ x $ 和參數 $ \theta $ 是具有聯合 pdf 的隨機變量
$$ p(x,,\theta)=p(x,|,\theta)p(\theta), $$ 這就是貝葉斯定理的分子中出現的內容。所以把可能性寫成條件概率密度而不是函數 $ L $ 的參數清楚地表明了基本的概率在起作用。