時間序列預測回溯窗口——滑動還是增長?
在在線時間序列預測(反之亦然)中,是否有充分的理由更喜歡滑動模型訓練窗口而不是增長窗口?我特別指的是金融時間序列。
我直觀地認為滑動窗口應該表現得更差——在樣本之外——因為它更有可能過度擬合特定的樣本窗口特徵,但我看到的一些經驗結果與此相反。
此外,鑑於某些人更喜歡滑動窗口,您的方法是確定回溯長度(除了純粹的啟發式方法之外,有什麼好的理由更喜歡一個而不是另一個)?
雖然我沒有指定模型,但一個例子可能是 ARIMA。
編輯:我應該補充一下,By有一篇相關的博客文章。Rob Hyndman,他稱之為“時間序列”交叉驗證。雖然它確實涵蓋了所描述的概念,但它並沒有給出關於為什麼一種方法可能優於另一種方法的正式理由,也沒有給出關於最佳回溯窗口參數的任何想法。
窗口長度的選擇涉及兩個相反因素之間的平衡。較短的窗口意味著執行估計的數據集較小。較長的窗口意味著數據生成過程在窗口覆蓋的時間段內發生變化的機會增加,因此最舊的數據不再代表系統的當前行為。
例如,假設您希望估計紐約一月份的平均氣溫。由於氣候變化,40 年前的數據不再代表當前狀況。但是,如果僅使用過去 5 年的數據,由於自然抽樣變異性,您的估計將具有很大的不確定性。
類似地,如果你試圖模擬道瓊斯工業平均指數的行為,你可以提取一個世紀前的數據。但您可能有正當理由相信 1920 年代的數據不能代表今天產生 DJIA 值的過程。
換句話說,較短的窗口會增加您的參數風險,而較長的窗口會增加您的模型風險。較短的數據樣本會增加您的參數估計偏離的可能性,具體取決於您的模型規範。更長的數據樣本會增加您嘗試擴展模型以涵蓋比其準確表示的更多案例的機會。更“本地化”的模型可能會做得更好。
因此,您選擇的窗口大小取決於您的特定應用程序——包括不同類型錯誤的潛在成本。如果您確定基礎數據生成過程是穩定的,那麼您擁有的數據越多越好。如果不是,那麼也許不是。
在不了解您的應用程序細節的情況下,恐怕我無法就如何適當地取得這種平衡提供更多見解。也許其他人可以提供指向特定統計測試的指針。
大多數人在實踐中所做的(不一定是最佳實踐)是密切關注它,選擇最長的窗口,在此期間基礎數據生成過程沒有發生“太大”的變化。這些判斷基於分析師對數據生成過程的啟發式理解。