在估計模型參數時最大化條件（對數）似然或聯合（對數）似然有什麼區別？

February 21, 2013

考慮一個響應y和數據矩陣X。假設我正在創建表單模型 -

y ~ g(X,)

(g() 可以是 X 的任何函數並且)

現在，為了估計使用最大似然 (ML) 方法，我可以使用條件 ML（假設我知道條件密度**f(y|X)的形式）或聯合 ML（假設我知道聯合密度f(y,X ) 的形式)**或等效地，f(X|y) * f(y) )

我想知道除了關於密度的假設之外，在繼續使用上述兩種方法中是否有任何考慮。此外，是否有任何實例（特定類型的數據）在大多數情況下一種方法勝過其他方法？

這取決於您以後想對模型做什麼。

聯合模型試圖預測整個分佈和. 它有一些有用的特性：

異常值檢測。可以識別與您的訓練樣本非常不同的樣本，因為它們的邊際概率很低。條件模型不一定能告訴你這一點。

有時更容易優化。例如，如果您的模型是高斯混合模型，那麼有很多方法可以將其擬合到您可以插入的聯合密度（期望最大化，變分貝葉斯），但是如果您想有條件地訓練它，事情會變得更加複雜。

根據模型的不同，訓練可以通過利用條件獨立性來並行化，如果有新數據可用，您還可以避免以後重新訓練它。EG 如果每個邊際分佈被單獨參數化，並且您觀察到一個新樣本，那麼您需要重新訓練的唯一邊際分佈是. 其他邊際分佈不受影響。此屬性在條件模型中不太常見。

我記得讀過一篇論文，其中指出聯合模型在有大量數據的情況下還有一些其他不錯的屬性，但不記得確切的聲明，或者在我的有趣論文的大文件夾中找到它。如果我以後找到它，我會提供參考。

然而，條件模型也有一些有趣的特性

他們可以很好地工作。

有些人在尋找合理的優化策略方面做了很多工作（例如支持向量機）

條件分佈的建模通常比聯合建模“更簡單”——要對後者建模，您必須對前者建模以及對邊際分佈建模。如果您只對準確預測什麼值感興趣是給定的，將模型的能力集中在單獨表示這一點上可能更明智。

引用自：https://stats.stackexchange.com/questions/50485

comments powered by Disqus

在估計模型參數時最大化條件（對數）似然或聯合（對數）似然有什麼區別？

相關問答

深度學習的模擬退火：為什麼無梯度統計學習不是主流？

用最大似然法尋找類別

MLE 和非正態性

為什麼最大似然估計量對異常值是可疑的？

RMSE 與 MSE 損失函數 - 優化解決方案是等價的嗎？

線性回歸和最小二乘回歸一定是一回事嗎？