我應該如何直觀地理解變分自編碼器中的 KL 散度損失？[複製]

February 25, 2019

我正在研究 VAE，遇到了由 KL 散度組成的損失函數。

我想直觀地理解損失函數的 KL 散度部分。如果有人可以幫助我，那就太好了

KL散度告訴我們概率分佈Q通過計算交叉熵減去熵來逼近概率分佈P的程度。直觀地說，您可以將其視為一種分佈與另一種分佈差異的統計度量。

在 VAE 中，讓成為我們要建模的數據，是潛變量，是數據的概率分佈，是潛在變量的概率分佈和是給定潛在變量的生成數據的分佈

在變分自動編碼器的情況下，我們的目標是推斷從 . 是將我們的數據投影到潛在空間的概率分佈。但是由於我們沒有分佈，我們使用其更簡單的估計來估計它 .

現在在訓練我們的 VAE 時，編碼器應該嘗試學習更簡單的分佈使其盡可能接近實際分佈 . 這就是我們使用 KL 散度來衡量兩個概率分佈之間差異的地方。因此，VAE 目標函數包括需要最小化的 KL 散度項。

引用自：https://stats.stackexchange.com/questions/394296

相關問答

Kullback-Leibler

互信息和 Kullback-Leibler 散度是否等價？

September 11, 2020

為什麼 Kullback-Leilbler 散度比平方誤差更能衡量兩個概率分佈之間的距離？[複製]

June 1, 2019

Neural-Networks

為什麼我們在變分自動編碼器中使用高斯分佈？

April 11, 2019

沒有採樣的高維推理問題中的不確定性估計？

February 22, 2019

Machine-Learning

高斯 VAE 的優化是否合適？

October 26, 2018

Machine-Learning

當使用變分自動編碼器生成樣本時，我們從ñ(0,1)ñ(0,1)N(0,1)代替μ+σñ(0,1)μ+σñ(0,1)mu + sigma N(0,1)

October 1, 2018