logloss的直觀解釋

April 20, 2016

在幾場 kaggle 比賽中，評分是基於“logloss”。這與分類錯誤有關。

這是一個技術答案，但我正在尋找一個直觀的答案。我真的很喜歡這個關於馬氏距離的問題的答案，但 PCA 不是對數損失。

我可以使用我的分類軟件輸出的值，但我不是很了解它。為什麼我們使用它而不是真/假陽性/陰性率？你能幫我解釋一下嗎？我的祖母或該領域的新手？

我也喜歡並同意這句話：

除非你能向你的祖母解釋，否則你不會真正理解某事

——阿爾伯特·愛因斯坦

在發帖之前，我嘗試自己回答這個問題。

我沒有發現直觀或真正有用的鏈接包括：

http://www.r-bloggers.com/making-sense-of-logarithmic-loss/

https://www.quora.com/What-is-an-intuitive-explanation-for-the-log-loss-function

https://lingpipe-blog.com/2010/11/02/evaluate-with-probabilistic-truth-log-loss-vs-0-1-loss/

https://www.kaggle.com/wiki/LogarithmicLoss

這些信息豐富且準確。它們適用於技術觀眾。他們沒有畫出簡單的圖畫，也沒有給出簡單易懂的例子。它們不是寫給我祖母的。

對數損失是所有概率乘積的對數。假設愛麗絲預測：

以 0.2 的概率，約翰會殺死傑克

以 0.001 的概率，瑪麗將嫁給約翰

比爾是兇手的概率為 0.01。

原來瑪麗沒有嫁給約翰，比爾不是兇手，而是約翰殺了傑克。根據 Alice 的說法，概率的乘積是 0.20.9990.99=0.197802

鮑勃預測：

以 0.5 的概率，約翰會殺死傑克

以 0.5 的概率，瑪麗將嫁給約翰

比爾是兇手的概率為 0.5。

乘積為 0.50.50.5=0.125。

Alice 是比 Bob 更好的預測者。

引用自：https://stats.stackexchange.com/questions/208443

comments powered by Disqus

logloss的直觀解釋

相關問答

為什麼我們更關心機器學習中的測試錯誤而不是預期的測試錯誤？

為什麼不以以下方式進行引導？

XGboost 和深度學習模型中 Tweedie 或泊松損失/目標函數的用途是什麼

做什麼磷(|Xn-X|≥ε)磷(|Xn-X|≥ε)P(|X_n - X| geq epsilon)直觀地表示？

我們想遠離意義嗎？

“統計推斷”的直觀解釋