Bayesian

後驗何時收斂到點質量?

  • October 6, 2020

模型的後驗收斂到無限觀察極限中的點質量的必要條件是什麼?打破這種收斂結果的例子是什麼?

在我的腦海中,我認為錯誤指定的模型或不可識別的模型會破壞這些收斂保證,但我該如何正式化呢?

編輯:對於那些因為問題含糊而投票結束的人,請在下面評論我如何解決您的問題。

由於似然收斂導致後驗收斂

看待“收斂”的一種方法是以常客的方式,為了增加樣本量,隨著概率的增加,真實參數的後驗概率會高,而假參數的概率會低。

為此,我們可以使用貝葉斯因子

P(θ1|x)P(θ0|x)=P(x|θ1)P(x|θ0)P(θ1)P(θ0)

在哪裡 θ0 是真正的參數值和 θ1 是任何其他替代值。(在貝葉斯上下文中談論真實參數可能有點奇怪,但談論後驗收斂可能也是如此,這可能更像是後驗的常客性質)

假設似然比 P(x|θ1)/P(x|θ0) 對於所有值,將收斂到 0 的概率 θ1 不具有與真實參數值的似然函數相同的似然函數 θ0 . (我們稍後會展示)

因此,如果 P(x|θ1)/P(x|θ0) 收斂,如果 P(θ0) 是非零的,那麼你將擁有 P(θ1|x)/P(θ0|x) 收斂。這意味著 P(x|θ) 收斂到/集中在點 θ0 .

模型的後驗收斂到無限觀察極限中的點質量的必要條件是什麼?

所以你需要兩個條件:

  • 兩個不同參數的似然函數一定是不同的。
  • P(θ) 對於正確的非零 θ . (您可以類似地爭論密度 f(θ) 如前所述)

直觀:如果您的先驗給出零密度/概率為真 θ 那麼後驗永遠不會給真實的非零密度/概率 θ ,無論您採集多大的樣本。


似然比收斂到零

大小樣本的似然比 n 收斂到零(當 θ1 不是真正的參數)。

P(x1,x2,,xn|θ1)P(x1,x2,,xn|θ0)P0

或負對數似然比

Λθ1,n=log(P(x1,x2,,xn|θ1)P(x1,x2,,xn|θ0))P

我們可以通過使用大數定律來證明這一點(我們需要假設測量是獨立的)。

如果我們假設測量是獨立的,那麼我們可以查看樣本大小的對數似然 n 作為單次測量的對數似然值的總和

Λθ1,n=log(P(x1,x2,,xn|θ1)P(x1,x2,,xn|θ0))=log(ni=1P(xi|θ1)P(xi|θ0))=ni=1log(P(xi|θ1)P(xi|θ0))

注意負對數似然的期望值

E[log(Px|θ1(x|θ1)Px|θ0(x|θ0))]=xχPx|θ0(x|θ0)log(Px|θ1(x|θ1)Px|θ0(x|θ0))0

類似於Kullback-Leibler 散度,它是正的,如Gibbs 不等式所示,並且當等式為零時出現 P(x|θ1)=P(x|θ0)

所以如果這個期望是正的,那麼根據大數定律, Λθ1,n/n 收斂到某個正常數 c

limnP(|Λθ1,nnc|>ϵ)=0

這意味著 Λθ1,n 會收斂到無窮大。對於任何 K>0

limnP(Λθ1,n<K)=0

引用自:https://stats.stackexchange.com/questions/490781