Loading [MathJax]/jax/output/NativeMML/config.js

Machine-Learning

訓練損失隨時間增加[重複]

January 24, 2018

我正在訓練一個模型（循環神經網絡）來對 4 種類型的序列進行分類。當我進行訓練時，我發現訓練損失一直在下降，直到我正確分類了訓練批次中超過 90% 的樣本。然而，幾個時期後，我注意到訓練損失增加了，我的準確率下降了。這對我來說似乎很奇怪，因為我希望在訓練集上性能應該隨著時間的推移而提高而不是惡化。我正在使用交叉熵損失，我的學習率為 0.0002。

**更新：**原來學習率太高了。在足夠低的學習率下，我沒有觀察到這種行為。但是我仍然覺得這很奇怪。歡迎任何好的解釋來解釋為什麼會發生這種情況

我在訓練 CNN 時也有類似的行為，這是因為我使用梯度下降和學習率衰減來計算誤差。您是否顯著增加了迭代次數並檢查了這種行為是否會隨著新的低學習率而出現得更晚？

引用自：https://stats.stackexchange.com/questions/324896

相關問答

Machine-Learning

一個神經網絡可以只用111隱藏層解決了什麼問題？

February 8, 2022

Machine-Learning

深度學習的模擬退火：為什麼無梯度統計學習不是主流？

January 5, 2022

Machine-Learning

哪個是第一位的 - 領域專業知識或實驗方法？

December 30, 2021

Neural-Networks

神經網絡可以處理負輸入和零輸入嗎？

December 22, 2021

Neural-Networks

在實踐中如何實現神經網絡參數的先驗分佈？

September 28, 2021

Machine-Learning

基礎模型：它是統計和機器學習的新範式嗎？

September 17, 2021