Time-Series

MAPE 是一個很好的誤差測量統計量嗎?還有什麼替代品?

  • May 19, 2017

我有一個處理降雨的時間序列。它為期 10 年(每日分辨率),涵蓋氣候變量。

我將把數據輸入人工神經網絡以預測降雨變量 (PP)。

正如我一直在閱讀的那樣,MAPE 的公式涉及除以實際觀察值。但由於降雨,將有幾天降水量很少或為零。

這很糟糕(除以零 = 黑洞)。那麼我該怎麼做呢?我可以對零或接近零的值進行數據替換,但這很愚蠢 - 如果我這樣做,我會誇大很多東西,並且在某種程度上篡改數據(與缺失值不同,應該估算通過其他數據而不是用其他任意值填充)。

我的教授像騾子一樣固執。MAPE有什麼替代品嗎?或者有什麼方法可以規避 MAPE 的問題?

編輯

數據集中有小值和零值……我現在是不是搞砸了?

不,實際上 MAPE 是非常差的誤差度量,正如 Stephan Kolassa 在優化 MAPE和預測準確性的最佳方式- 另一種度量而不是 MAPE和最小化對稱平均絕對百分比誤差 (SMAPE)那些幻燈片中所討論的那樣。您還可以查看以下論文:

Tofallis, C. (2015)。更好地衡量模型選擇和模型估計的相對預測精度。運籌學學會雜誌,66(8),1352-1362。

Goodwin 和 Lawton (1999) 在On the asymmetry of the symmetric MAPE論文中也對此進行了討論

儘管 MAPE 被廣泛使用,但它有幾個缺點(Armstrong & Collopy,1992;Makridakis,1993)。特別是,Makridakis 認為 MAPE 是不對稱的,因為“高於實際值的相同誤差導致 APE 大於低於實際值的誤差”。類似地,阿姆斯特朗和科洛比認為,“MAPE ……對超出實際的預測的懲罰比對低於實際的預測要重。例如,MAPE 在低端有 100% 的誤差,但在高端沒有限制。

引用的 (Makridakis, 1993) 論文為不對稱提供了一個很好的例子,當預測值為預測是, MAPE 是,而當預測值為預測是MAPE 是儘管這兩個預測都是錯誤的單位!

上述參考資料和其他來源的數量表明,如果您使用 MAPE 作為選擇預測的標準,這將導致有偏差和低估的結果。此外,當預測值為零時,您會遇到問題。

如何解釋 Weka 輸出中的錯誤度量?線程你可以找到其他錯誤措施的簡要回顧。

引用自:https://stats.stackexchange.com/questions/280464

comments powered by Disqus