Mean

有人可以給出平均絕對誤差和中位數背後的直覺嗎?[複製]

  • September 22, 2019

如果我們要使用平均絕對誤差來判斷預測準確性,我不明白為什麼中位數是最佳估計值背後的直覺。假設你有一個隨機變量 $ X $ 你想預測接下來會發生什麼 $ X $ 是。讓我們將您的預測表示為 d。

在均方誤差下,即:

$ \text{MSE} = (X - d)^2 $

我們知道預期 MSE 或 MSE 之和在以下情況下最小化 $ d $ 等於平均值或 $ E[X] $ . 這在直覺上是有道理的。隨機變量的最佳預測指標是其均值。

但是,在平均絕對誤差下,即:

$ \text{MAE} = |X - d| $

預期的 MAE 或 MAE 的總和最小化 $ d $ 等於隨機變量的中位數。雖然我正在閱讀的這本書有一個精美的證據來說明為什麼會出現這種情況,但直覺上我不明白為什麼中位數會是最好的預測指標。我也不明白為什麼平均值(或中位數)不是兩者的最佳選擇。

這是一個關於輕數學的直觀論點。假設我們有一個 $ d $ 聲稱要最小化點的 MAE $ x_i $ . 而且,假設我們有 $ n_l $ 和 $ n_r $ 點在它的左邊和右邊。如果我們搬家 $ d $ 稍微左一點,即一定量 $ \Delta $ ,那麼左邊的所有絕對差將減少 $ \Delta $ ,並且右邊的所有絕對差將增加 $ \Delta $ ,導致淨減少 $ (n_l-n_r)\Delta $ 在 MAE。如果 $ n_l\neq n_r $ , $ d $ 總是有動力向左或向右移動,因為每次移動都會減少或增加 MAE。例如,如果 $ n_r<n_l $ ,然後我們向左移動,因為 MAE 的淨減少是 $ (n_l-n_r)\Delta $ , 而如果 $ n_l<n_r $ 我們向右移動,因為淨減少量將是 $ (n_r-n_l)\Delta $ . 這一直持續到我們到達 $ n_l=n_r $ ,中位數滿足。

引用自:https://stats.stackexchange.com/questions/428169

comments powered by Disqus