（為什麼）絕對損失不是正確的計分規則嗎？

June 23, 2020

Brier score 是一個合適的評分規則，至少在二元分類的情況下是平方損失。

顯然，當有三個或更多類時，可以對此進行調整。

在Cross Validated 的另一篇文章中，提到絕對損失不是正確的評分規則。

它似乎與 Brier 評分非常相似，應該是一個正確的評分規則。

為什麼絕對損失不是正確的評分規則？

當有兩個以上的輸出類別時，絕對損失是否是二進制分類情況下失去其“適當性”的適當評分規則？

當有兩個以上的課程時，是否可以像 Brier 分數那樣處理絕對損失以獲得適當的形式？

至少在二元情況下，絕對損失比 Brier 分數或 Brier 分數的平方根更容易解釋，因為它表示預測概率與觀察到的結果不同的平均量，所以我想有一種方法絕對損失是適當的。

讓我們首先確保我們就定義達成一致。考慮一個二元隨機變量，並考慮損失函數，在哪裡是一個估計給定數據。在你的例子中，是觀測數據的函數和 . Brier 得分損失函數為 , 絕對損失函數為 . 損失函數具有預期損失 . 如果預期損失，則損失函數是正確的得分規則 相對於最小化通過設置對於任何 .

驗證這一點的一個方便技巧是使用，至於任何預期損失，我們有

讓我們首先驗證 Bier 損失函數是否是正確的得分規則。注意，和，所以使用上面的，我們有

並對該函數求導並設置為會給你選擇最小化預期風險。所以 Brier 分數確實是一個適當的分數規則。

相反，回想一下二元性質，我們可以寫出絕對損失作為
作為 . 因此，我們有

很遺憾，不會被最小化，並且通過考慮邊緣情況，您可以證明被最小化什麼時候，並由什麼時候 , 並適用於任何選擇什麼時候 .

因此，要回答您的問題，絕對損失不是正確的評分規則，並且與輸出類別的數量無關。至於能不能摔跤，我當然想不出辦法……我想這樣的嘗試去想類似的辦法，很可能會把你引向 Brier 分數 :)。

編輯：

針對 OP 的評論，請注意絕對損失方法基本上是估計，在二進制情況下是預期的或者根據 . 絕對損失並沒有對替代選擇造成足夠的懲罰，以至於您想要選擇除了顯示最多的值之外的任何東西。相反，平方誤差對備選方案的懲罰足以找到與均值一致的中間立場 . 這也應該強調使用絕對損失作為分類器沒有任何問題，並且您可以認為它與確定給定問題有關，如果您更關心平均值或中位數。對於二進制數據，我個人認為平均值更有趣（知道中位數可以告訴您 p > .5，但知道平均值可以告訴您更精確的陳述 )，但這取決於。正如另一篇文章也強調的那樣，絕對損失沒有錯，它只是不是一個正確的分數規則。

引用自：https://stats.stackexchange.com/questions/473702

（為什麼）絕對損失不是正確的計分規則嗎？

相關問答

哪個是第一位的 - 領域專業知識或實驗方法？

可以使用多項式邏輯回歸學習任何數據嗎

為什麼我們更關心機器學習中的測試錯誤而不是預期的測試錯誤？

我如何使我的二元分類器偏愛假陽性錯誤而不是假陰性？

邏輯回歸是神經網絡的一個特例嗎？

XGboost 和深度學習模型中 Tweedie 或泊松損失/目標函數的用途是什麼