Machine-Learning

為什麼不使用純指數作為神經網絡的激活函數？

June 26, 2021

ReLU 函數通常用作機器學習中的激活函數，以及它的修改（ELU，leaky ReLU）。

這些函數的總體思路是相同的：在x = 0函數的值很小之前（其無窮大的極限為零或-1），在x = 0函數與 x 成比例增長之後。

指數函數 (e^x或e^x-1) 具有類似的行為，並且它的導數x = 0大於 sigmoid。

下面的可視化說明了與 ReLU 和 sigmoid 激活函數相比的指數。

那麼，為什麼y=e^x在神經網絡中不使用簡單函數作為激活函數呢？

我認為最突出的原因是穩定性。考慮具有指數激活的後續層，以及當您向 NN 輸入少量數字時輸出會發生什麼（例如 $ x=1 $ )，前向計算將如下所示： $$ o=\exp(\exp(\exp(\exp(1))))\approx e^{3814279} $$

它會很快變得瘋狂，我認為你不能用這個激活函數訓練深度網絡，除非你添加其他機制，比如裁剪。

引用自：https://stats.stackexchange.com/questions/532309

comments powered by Disqus

相關問答

Machine-Learning

一個神經網絡可以只用111隱藏層解決了什麼問題？

February 8, 2022

Machine-Learning

深度學習的模擬退火：為什麼無梯度統計學習不是主流？

January 5, 2022

Machine-Learning

哪個是第一位的 - 領域專業知識或實驗方法？

December 30, 2021

Neural-Networks

神經網絡可以處理負輸入和零輸入嗎？

December 22, 2021

Neural-Networks

在實踐中如何實現神經網絡參數的先驗分佈？

September 28, 2021

Machine-Learning

基礎模型：它是統計和機器學習的新範式嗎？

September 17, 2021