Neural-Networks

損失函數的二階近似（深度學習書籍，7.33）

April 24, 2019

在 Goodfellow（2016 年）關於深度學習的書中，他談到了提前停止與 L2 正則化的等效性（https://www.deeplearningbook.org/contents/regularization.html第 247 頁）。

成本函數的二次逼近是（誰）給的：

$$ \hat{J}(\theta)=J(w^)+\frac{1}{2}(w-w^)^TH(w-w^*) $$

在哪裡是 Hessian 矩陣（方程 7.33）。這是缺少中期嗎？泰勒展開式應該是：

他們談論最佳重量：

我們可以對成本函數進行建模在權重的經驗最優值附近具有二次近似

此時，一階導數為零——因此省略了中間項。

引用自：https://stats.stackexchange.com/questions/404781

相關問答

Machine-Learning

為什麼我們更關心機器學習中的測試錯誤而不是預期的測試錯誤？

July 28, 2021

Machine-Learning

XGboost 和深度學習模型中 Tweedie 或泊松損失/目標函數的用途是什麼

October 19, 2020

Machine-Learning

（為什麼）絕對損失不是正確的計分規則嗎？

June 23, 2020

Machine-Learning

機器學習中的損失函數——如何約束？

April 30, 2020

邏輯函數從何而來？

April 8, 2020

Neural-Networks

能罪(𝑥)罪⁡(X)sin(x)在深度學習中用作激活？

April 12, 2019