Error

RMSE 與確定係數

  • October 4, 2012

我正在評估一個物理模型,並想知道我應該在這裡使用哪種方法(在 RMSE 和確定係數 R2 之間)

問題如下:我有一個函數可以輸出對輸入值 x 的預測,. 我也有我所說的那個值的實際觀察結果.

我的問題是 RMSE 或. 我已經看到它們都被用於我正在研究的問題的論文中。

這兩個我都用過,有幾點要說。

  • rmse 很有用,因為它很容易解釋。每個人都知道它是什麼。
  • rmse 不顯示相對值。如果,你必須具體知道範圍. 如果, 那麼 0.2 是一個很好的值。如果, 好像沒那麼好了。
  • 與前面的方法一致,rmse 是一種很好的方法來隱藏您調查的人或您進行的測量大多是一致的(每個人都給產品打了 3 星),並且您的結果看起來不錯,因為數據幫助了您。如果數據有點隨機,您會發現您的模型繞木星運行。
  • 使用調整後的決定係數,而不是普通的
  • 決定係數很難解釋。即使是該領域的人也需要一個腳註提示,例如 \footnote{調整後的決定係數是數據集中可以通過統計模型解釋的可變性比例。該值顯示模型對未來結果的預測程度。可以取 0 為最小值, 1 為最大值。}
  • 然而,確定係數在說明您的模型對現象的解釋程度方面非常精確。如果, 不管價值觀,你的模型很糟糕。我相信一個好的模型的臨界點從 0.6 開始,如果你有 0.7-0.8 左右的東西,你的模型就是一個非常好的模型。
  • 回顧一下,說,使用您的模型,您可以解釋真實數據中 70% 的情況。剩下的 30% 是你不知道也無法解釋的。這可能是因為存在混雜因素,或者您在構建模型時犯了一些錯誤。
  • 在計算機科學中,幾乎每個人都使用 rmse。社會科學使用更頻繁。
  • 如果您不需要證明模型中的參數,只需使用 rmse。但是,如果您在構建模型時需要輸入、刪除或更改參數,則需要使用表明這些參數可以最好地解釋數據。
  • 如果你會使用, R 語言的代碼。它有庫,你只需給它數據就可以得到所有結果。

對於一個有抱負的計算機科學家來說,寫關於統計的文章是令人興奮的。敬上。

引用自:https://stats.stackexchange.com/questions/38631

comments powered by Disqus

相關問答