Neural-Networks

在反向傳播中將所有初始權重設置為零的危險

April 25, 2012

為什麼用零初始化權重很危險？有沒有簡單的例子來證明它？

編輯見下面阿爾法的評論。我不是神經網絡方面的專家，所以我會聽從他的意見。

我的理解與此處發布的其他答案不同。

我很確定反向傳播涉及增加現有權重，而不是相乘。您添加的數量由delta 規則指定。請注意，wij 不會出現在等式的右側。

我的理解是，至少有兩個充分的理由不將初始權重設置為零：

首先，神經網絡往往會陷入局部最小值，因此給它們提供許多不同的起始值是個好主意。如果它們都從零開始，你就不能這樣做。

其次，如果神經元以相同的權重開始，那麼所有神經元將遵循相同的梯度，並且最終總是會彼此做同樣的事情。

引用自：https://stats.stackexchange.com/questions/27112

comments powered by Disqus

相關問答

Machine-Learning

深度學習的模擬退火：為什麼無梯度統計學習不是主流？

January 5, 2022

Machine-Learning

神經 ODE 的實際用途是什麼？

January 20, 2020

Neural-Networks

能罪(𝑥)罪⁡(X)sin(x)在深度學習中用作激活？

April 12, 2019

Machine-Learning

MNIST 數字識別：僅使用完全連接的 NN，我們能獲得的最佳效果是什麼？（沒有CNN）

November 10, 2018

Backpropagation

變分自動編碼器如何通過採樣步驟反向傳播[重複]

April 25, 2018

Machine-Learning

為什麼 tanh 作為激活函數幾乎總是比 sigmoid 好？

February 26, 2018