Tensorflow
為什麼在 softmax 中使用“e”?
我正在用 tensorflow 介紹 ML,我遇到了 softmax 激活函數。為什麼在 softmax 公式中e?為什麼不是2?3? 7?
使用不同的基數相當於縮放數據
讓 z=(lna)y
現在觀察 ezi=ayi 因此:
ezi∑jezj=ayi∑jayj
乘法向量 y 的自然對數 a 相當於將softmax函數切換為base a 而不是基地 e .
您通常在 softmax 函數中有一個線性模型(例如。 zi=x′wi )。這 w 在 x′w 可以擴展數據,因此允許不同的基礎不會增加任何解釋力。如果縮放比例可以改變,那麼不同的基數是有感覺的 a 都是等效模型。
那為什麼要基 e ?
在指數設置中, e 通常是最美觀、最自然的使用基礎: ddxex=ex . 當你使用 base 時,很多數學在頁面上看起來更漂亮 e .