Standard-Deviation

對均方根誤差和平均偏差偏差的概念理解

  • May 29, 2012

我想對均方根誤差 (RMSE) 和平均偏差 (MBD) 有一個概念性的了解。在為我自己的數據比較計算了這些度量之後,我經常困惑地發現 RMSE 很高(例如,100 kg),而 MBD 很低(例如,小於 1%)。

更具體地說,我正在尋找列出和討論這些措施的數學的參考資料(不是在線的)。通常接受的計算這兩個指標的方法是什麼,我應該如何在期刊論文中報告它們?

在這篇文章的上下文中,擁有一個可用於描述這兩個度量計算的“玩具”數據集將非常有幫助。

例如,假設我要找出一條裝配線生產的 200 個小部件的質量(以 kg 為單位)。我還有一個數學模型,可以嘗試預測這些小部件的質量。該模型不必是經驗的,它可以是基於物理的。我計算了實際測量值和模型之間的 RMSE 和 MBD,發現 RMSE 為 100 kg,MBD 為 1%。這在概念上意味著什麼,我將如何解釋這個結果?

現在假設我從這個實驗的結果中發現 RMSE 是 10 kg,MBD 是 80%。這是什麼意思,我能對這個實驗說些什麼?

這些措施的含義是什麼,它們兩者(合起來)意味著什麼?與 RMSE 一起考慮時,MBD 提供了哪些附加信息?

我認為這些概念很容易解釋。所以我寧願在這裡描述它。我相信很多基礎統計學書籍都涵蓋了這一點,包括我的書《內科醫生、護士和臨床醫生的生物統計學基礎》。

想像一個中間有靶心的目標。均方誤差表示從箭射到目標和中心的平均平方距離。現在,如果您的箭頭均勻地散佈在中心周圍,那麼射手就沒有瞄準偏差,並且均方誤差與方差相同。

但一般來說,箭頭可以圍繞遠離目標的一點散開。箭頭到箭頭中心的平均平方距離就是方差。這個中心可以看作是射手的瞄準點。從這個射手中心或瞄準點到目標中心的距離是偏差的絕對值。

考慮一個直角三角形,其中斜邊的平方是兩條邊的平方和。所以從箭頭到目標的平方距離是箭頭到目標點距離的平方和目標中心到目標點之間距離的平方。對所有這些平方距離求平均得到均方誤差,即偏差平方和方差之和。

引用自:https://stats.stackexchange.com/questions/29356

comments powered by Disqus