Interpretation
logloss的直觀解釋
在幾場 kaggle 比賽中,評分是基於“logloss”。這與分類錯誤有關。
這是一個技術答案,但我正在尋找一個直觀的答案。我真的很喜歡這個關於馬氏距離的問題的答案,但 PCA 不是對數損失。
我可以使用我的分類軟件輸出的值,但我不是很了解它。為什麼我們使用它而不是真/假陽性/陰性率?你能幫我解釋一下嗎?我的祖母或該領域的新手?
我也喜歡並同意這句話:
除非你能向你的祖母解釋,否則你不會真正理解某事
——阿爾伯特·愛因斯坦
在發帖之前,我嘗試自己回答這個問題。
我沒有發現直觀或真正有用的鏈接包括:
- http://www.r-bloggers.com/making-sense-of-logarithmic-loss/
- https://www.quora.com/What-is-an-intuitive-explanation-for-the-log-loss-function
- https://lingpipe-blog.com/2010/11/02/evaluate-with-probabilistic-truth-log-loss-vs-0-1-loss/
- https://www.kaggle.com/wiki/LogarithmicLoss
這些信息豐富且準確。它們適用於技術觀眾。他們沒有畫出簡單的圖畫,也沒有給出簡單易懂的例子。它們不是寫給我祖母的。
對數損失是所有概率乘積的對數。假設愛麗絲預測:
- 以 0.2 的概率,約翰會殺死傑克
- 以 0.001 的概率,瑪麗將嫁給約翰
- 比爾是兇手的概率為 0.01。
原來瑪麗沒有嫁給約翰,比爾不是兇手,而是約翰殺了傑克。根據 Alice 的說法,概率的乘積是 0.20.9990.99=0.197802
鮑勃預測:
- 以 0.5 的概率,約翰會殺死傑克
- 以 0.5 的概率,瑪麗將嫁給約翰
- 比爾是兇手的概率為 0.5。
乘積為 0.50.50.5=0.125。
Alice 是比 Bob 更好的預測者。