Markov-Chain-Montecarlo
MCMC 僅僅是概率梯度下降嗎?
我正在學習馬爾可夫鏈蒙特卡羅方法,在我未分化的頭腦中,它們基本上類似於梯度下降,其中隨機分量取代了梯度計算。這是不是一個正確的理解。如果不是,我錯過了什麼關鍵區別?
關鍵的區別在於我們沒有試圖優化任何東西。相反,我們試圖估計一個密度函數 - 但不是通過以某種最佳方式估計少量參數,而是通過從密度函數生成大量隨機數並從那裡開始。所以 MCMC 實際上是一種隨機數生成技術,而不是一種優化技術。
要查看具有隨機分量的類似梯度下降的算法是什麼樣的,請查看stochastic approximation。同時擾動變體非常有效且易於使用。