Probability
為什麼貝葉斯的歸一化常數不是邊際分佈
貝葉規則的公式如下p(θ|D)=p(D|θ)p(θ)∫p(D|θ)p(θ)dθ
在哪裡 ∫p(D|θ)p(θ)dθ 是歸一化常數 z . 怎麼 z 當評估積分成為邊際分佈時,評估為常數 p(D) ?
p(D) 是關於變量的常數 θ ,而不是關於變量 D .
考慮到 D 作為問題中給出的一些數據和 θ 作為要從數據中估計的參數。在這個例子中, θ 是可變的,因為我們不知道要估計的參數的值,但數據 D 是固定的。 p(D) 給出觀察固定數據的相對可能性 D 我們觀察到的,當 D 是恆定的並且不以任何方式依賴於可能的參數值 θ .
**附錄:**可視化肯定會有所幫助。讓我們制定一個簡單的模型:假設我們的先驗分佈是均值為 0,方差為 1 的正態分佈,即 p(θ)=N(0,1)(θ) . 假設我們要觀察一個數據點 D , 在哪裡 D 從具有均值的正態分佈中得出 θ 和方差1,即 p(D|θ)=N(θ,1)(D) . 下面繪製的是未歸一化的後驗分佈 p(D|θ)p(θ) ,與歸一化後驗成正比 p(θ|D)=p(D|θ)p(θ)p(D) .
對於任何特定的值 D ,看看這張圖的一部分(我用紅色和藍色顯示了兩個)。這裡 p(D)=∫p(D|θ)p(θ)dθ 可以可視化為每個切片下方的區域,我也將其繪製為綠色。由於藍色切片的面積比紅色切片大,因此它具有更高的 p(D) . 但是您可以清楚地看到,如果它們下面有不同的區域,則它們目前不能是正確的分佈,因為它們兩個的區域都不能為 1。這就是為什麼每個切片需要通過除以其值來歸一化 p(D) 使其成為適當的分佈。