為什麼在 softmax 中使用“e”？

August 6, 2017

我正在用 tensorflow 介紹 ML，我遇到了 softmax 激活函數。為什麼在 softmax 公式中e？為什麼不是2？3? 7?

張量流教程

神經網絡書

使用不同的基數相當於縮放數據

讓

現在觀察因此：

乘法向量的自然對數相當於將softmax函數切換為base 而不是基地 .

您通常在 softmax 函數中有一個線性模型（例如。）。這在可以擴展數據，因此允許不同的基礎不會增加任何解釋力。如果縮放比例可以改變，那麼不同的基數是有感覺的都是等效模型。

那為什麼要基 ?

在指數設置中，通常是最美觀、最自然的使用基礎： . 當你使用 base 時，很多數學在頁面上看起來更漂亮 .

引用自：https://stats.stackexchange.com/questions/296471

為什麼在 softmax 中使用“e”？

使用不同的基數相當於縮放數據

那為什麼要基 ?

相關問答

溫度在 Softmax 中的作用是什麼？

Softmax溢出[關閉]

如何在 scikit-learn 的多層感知器中應用 Softmax 作為激活函數？[關閉]

使用 Softmax / 交叉熵進行反向傳播

Logistic分類器中的Softmax vs Sigmoid函數？

交叉熵損失函數的不同定義

為什麼在 softmax 中使用“e”？

使用不同的基數相當於縮放數據

那為什麼要基 e ?

相關問答

溫度在 Softmax 中的作用是什麼？

Softmax溢出[關閉]

如何在 scikit-learn 的多層感知器中應用 Softmax 作為激活函數？[關閉]

使用 Softmax / 交叉熵進行反向傳播

Logistic分類器中的Softmax vs Sigmoid函數？

交叉熵損失函數的不同定義

那為什麼要基 ?