Time-Series

短時間序列的最佳方法

  • January 26, 2015

我有一個與短時間序列建模有關的問題。是否建模不是問題,而是如何建模。你會推薦什麼方法來建模(非常)短時間序列(比如長度)? “最好”在這裡是指最穩健的,由於觀察次數有限,最不容易出錯。對於短系列的單一觀測可能會影響預測,因此該方法應謹慎估計與預測相關的誤差和可能的可變性。我通常對單變量時間序列感興趣,但了解其他方法也會很有趣。

非常簡單的預測方法(例如“預測歷史平均值”)優於更複雜的方法是很常見的。對於短時間序列來說,這種情況更有可能發生。是的,原則上您可以將 ARIMA 或更複雜的模型擬合到 20 個或更少的觀測值,但您很可能會過度擬合併得到非常糟糕的預測。

所以:從一個簡單的基准開始,例如,

  • 歷史平均值
  • 增加穩健性的歷史中值
  • 隨機遊走(預測最後的觀察結果)

根據樣本外數據評估這些。將任何更複雜的模型與這些基准進行比較。您可能會驚訝地發現要超越這些簡單的方法是多麼困難。此外,將不同方法與這些簡單方法的穩健性進行比較,例如,不僅要評估樣本外的平均準確度,還要評估誤差方差,使用您最喜歡的誤差度量

是的,正如Rob Hyndman 在Aleksandr 鏈接到的帖子中所寫,樣本外測試本身就是短系列的一個問題——但確實沒有好的選擇。(不要使用樣本內擬合,這不是預測準確性的指南。)AIC 不會幫助您處理中位數和隨機遊走。但是,無論如何,您都可以使用AIC 近似的時間序列交叉驗證。

引用自:https://stats.stackexchange.com/questions/135061

comments powered by Disqus