Interpretation

logloss的直觀解釋

  • April 20, 2016

在幾場 kaggle 比賽中,評分是基於“logloss”。這與分類錯誤有關。

這是一個技術答案,但我正在尋找一個直觀的答案。我真的很喜歡這個關於馬氏距離的問題的答案,但 PCA 不是對數損失。

我可以使用我的分類軟件輸出的值,但我不是很了解它。為什麼我們使用它而不是真/假陽性/陰性率?你能幫我解釋一下嗎?我的祖母或該領域的新手?

我也喜歡並同意這句話:

除非你能向你的祖母解釋,否則你不會真正理解某事

——阿爾伯特·愛因斯坦

在發帖之前,我嘗試自己回答這個問題。

我沒有發現直觀或真正有用的鏈接包括:

這些信息豐富且準確。它們適用於技術觀眾。他們沒有畫出簡單的圖畫,也沒有給出簡單易懂的例子。它們不是寫給我祖母的。

對數損失是所有概率乘積的對數。假設愛麗絲預測:

  • 以 0.2 的概率,約翰會殺死傑克
  • 以 0.001 的概率,瑪麗將嫁給約翰
  • 比爾是兇手的概率為 0.01。

原來瑪麗沒有嫁給約翰,比爾不是兇手,而是約翰殺了傑克。根據 Alice 的說法,概率的乘積是 0.20.9990.99=0.197802

鮑勃預測:

  • 以 0.5 的概率,約翰會殺死傑克
  • 以 0.5 的概率,瑪麗將嫁給約翰
  • 比爾是兇手的概率為 0.5。

乘積為 0.50.50.5=0.125。

Alice 是比 Bob 更好的預測者。

引用自:https://stats.stackexchange.com/questions/208443

comments powered by Disqus