Machine-Learning

“變量”是什麼意思?

  • April 17, 2018

“變分”的使用是否總是指通過變分推理進行優化?

例子:

  • “變分自動編碼器”
  • “變分貝葉斯方法”
  • “變分重整化群”

這意味著使用變分推理(至少對於前兩個)。

簡而言之,它是一種在概率密度複雜(因此 MLE 很難)時近似最大似然的方法。

它使用證據下界 (ELBO) 作為 ML 的代理:

在哪裡是隱藏變量上更簡單的分佈(表示為) - 例如,變分自動編碼器在編碼器的輸出上使用正態分佈。

‘variational’ 這個名字很可能來自它搜索分佈的事實優化 ELBO,這種設置有點像變分微積分,這是一個研究函數優化的領域(例如,問題如下:給定兩點之間的二維曲線族,找到一個長度最小的曲線)。

David Blei有一個很好的關於變分推理 的教程,如果您想要更具體的描述,可以查看。

編輯:

實際上我描述的是一種VI:通常你可以使用不同的散度(我描述的對應於使用KL散度)。有關詳細信息,請參閱本文第 5.2 節(具有替代分歧的 VI)。

引用自:https://stats.stackexchange.com/questions/340955

comments powered by Disqus