Loading [MathJax]/jax/output/NativeMML/config.js

Machine-Learning

“變量”是什麼意思？

April 17, 2018

“變分”的使用是否總是指通過變分推理進行優化？

例子：

“變分自動編碼器”

“變分貝葉斯方法”

“變分重整化群”

這意味著使用變分推理（至少對於前兩個）。

簡而言之，它是一種在概率密度複雜（因此 MLE 很難）時近似最大似然的方法。

它使用證據下界 (ELBO) 作為 ML 的代理：

在哪裡是隱藏變量上更簡單的分佈（表示為) - 例如，變分自動編碼器在編碼器的輸出上使用正態分佈。

‘variational’ 這個名字很可能來自它搜索分佈的事實優化 ELBO，這種設置有點像變分微積分，這是一個研究函數優化的領域（例如，問題如下：給定兩點之間的二維曲線族，找到一個長度最小的曲線）。

David Blei有一個很好的關於變分推理的教程，如果您想要更具體的描述，可以查看。

編輯：

實際上我描述的是一種VI：通常你可以使用不同的散度（我描述的對應於使用KL散度）。有關詳細信息，請參閱本文第 5.2 節（具有替代分歧的 VI）。

引用自：https://stats.stackexchange.com/questions/340955

相關問答

Machine-Learning

深度學習的模擬退火：為什麼無梯度統計學習不是主流？

January 5, 2022

Machine-Learning

RMSE 與 MSE 損失函數 - 優化解決方案是等價的嗎？

June 27, 2021

如何解釋 Pearl 的 do 表示法？

June 8, 2021

線性回歸和最小二乘回歸一定是一回事嗎？

May 11, 2021

傾向得分匹配的用例是什麼？

April 30, 2021

為什麼我們在進行 MLE 時將對數似然乘以 -2？

April 10, 2021