Forecasting
為什麼不使用 R 平方來衡量預測準確性?
為什麼在文獻中通常使用 MAD、MSE、RMSE、MAPE 等常見的精度度量。為什麼不使用(確定係數)?
我在考慮不同之處:通過使用 MSE,我可以比較預測的平均值。並且在使用時我將獲得有關差異的信息。
為什麼最常用的是平均值比較?有人可以給我一個提示嗎?
樣本內 不是預測準確性的合適度量,因為它沒有考慮過擬合。總是可以建立一個複雜的模型來完美地擬合樣本中的數據,但不能保證這樣的模型在樣本外表現得很好。
樣本外 ,即預測值和實際值之間的平方相關性,是有缺陷的,因為它沒有考慮預測中的偏差。
例如,考慮實現的價值
和兩個相互競爭的預測:
和
現在假設
對於每個, 在哪裡是一個常數。也就是說,預測是相同的,只是第二個要高. 這兩個預測通常會有不同的 MSE、MAPE 等,但將是相同的。
考慮一個極端情況:第一個預測是完美的,即對於每個. 這這個預測的值為 1(非常好)。但是,那的其他預測也將為 1,即使預測有偏差對於每個.