Likelihood
為什麼使用濾波器結果而不是更平滑的結果計算卡爾曼濾波器的似然性?
我以非常標準的方式使用卡爾曼濾波器。系統由狀態方程表示和觀察方程.
教科書教導說,在應用卡爾曼濾波器並獲得“一步預測”之後(或“過濾估計”),我們應該使用它們來計算似然函數:
我的問題是:為什麼使用“過濾估計”計算似然函數而不是“平滑估計”? 不是嗎更好地估計狀態向量?
要回答您的問題:您可以使用平滑密度。但你不必這樣做。Jarle Tufto 的答案具有您正在使用的分解。但還有其他人。
使用卡爾曼遞歸
在這裡,您將可能性評估為
但是,平均值和方差通常並不總是完全定義概率分佈。以下是您用於過濾分佈的分解條件似然:
這裡 是狀態轉移密度……模型的一部分,以及是觀察密度……再次成為模型的一部分。在您的問題中,您將這些寫為和分別。這是同一件事。
當您獲得領先一步的狀態預測分佈時,這就是計算. 當你再次積分時,你完全得到(1)。你在你的問題中完全寫出那個密度,這是一回事。
在這裡,您僅使用概率分佈的分解和關於模型的假設。該似然計算是精確計算。沒有任何自由裁量權可以用來更好或更糟地做到這一點。
使用 EM 算法
據我所知,沒有其他方法可以直接在這種狀態空間模型中評估可能性。但是,您仍然可以通過評估不同的函數來進行最大似然估計:您可以使用 EM 算法。在期望步驟(E-Step)中,您將計算
這裡是“完整數據”的可能性,並且您正在考慮關於聯合平滑密度的對數的期望。經常發生的情況是,因為您正在獲取這個完整數據可能性的對數,所以這些術語被分成總和,並且由於期望算子的線性,您正在獲取關於邊際平滑分佈的期望(那些你在你的問題中提到)。 其他事情
我在某些地方讀到過 EM 是一種最大化可能性的“更穩定”方式,但我從來沒有真正看到這一點得到很好的論證,我也沒有看到“穩定”這個詞的定義,但我也沒有’並沒有真正進一步檢查。這些算法都沒有繞過局部/全局最大值的考驗。我個人傾向於出於習慣更頻繁地使用卡爾曼。
確實,狀態的平滑估計通常比過濾具有更小的方差,所以我想你對此有一些直覺是對的,但你並沒有真正使用狀態。您試圖最大化的可能性不是狀態的函數。