為什麼信息標準（未調整R2R2R^2) 用於在時間序列模型中選擇適當的滯後順序？

February 17, 2016

在時間序列模型中，如 ARMA-GARCH，為了選擇模型的適當滯後或階數，使用了不同的信息準則，如 AIC、BIC、SIC 等。

我的問題很簡單，我們為什麼不使用調整選擇合適的型號？我們可以選擇導致調整值更高的模型. 因為兩者都調整了和信息標準對模型中額外數量的回歸器進行懲罰，其中前者懲罰然後懲罰似然值。

我認為至少在討論線性模型（如 AR 模型）時，已調整和AIC沒有什麼不同。

考慮是否應該包含在

這相當於比較模型

在哪裡. 我們說是真正的模型，如果. 請注意. 模型因此是嵌套的。模型選擇程序是一個依賴於數據的規則，它選擇幾個模型中最合理的。我們說是一致的，如果

考慮調整. 也就是說，選擇如果. 作為是單調遞減的，這個過程相當於最小化. 反過來，這相當於最小化. 對於足夠大, 後者可以寫成

在哪裡是誤差方差的 ML 估計量。選型依據因此漸近等價於選擇最小的模型 . 這個程序是不一致的。命題：

證明：

其中倒數第二行是因為統計量是線性回歸情況下遵循漸近線的 LR 統計量零分佈。量子點現在考慮 Akaike 的標準，

因此，AIC 還權衡了額外回歸變量所隱含的 SSR 減少與指向相反方向的“懲罰項”。因此，選擇如果 , 否則選擇. 可以看出，通過在第三行繼續上述證明也不一致. 調整後的和因此選擇“大”模型具有正概率，即使是真正的模型。

因為 AIC 中復雜性的懲罰比調整後的要大一些，但它可能不太容易過度選擇。它還有其他很好的特性（如果不在考慮的模型集中，則將 KL 散度最小化到真實模型），這些特性在我的帖子中沒有提到。

引用自：https://stats.stackexchange.com/questions/197112

為什麼信息標準（未調整R2R2R^2) 用於在時間序列模型中選擇適當的滯後順序？

相關問答

為什麼在計算自相關時減去平均值？

為什麼非獨立同分佈噪聲對傳統的時間序列方法如此重要？

ADF 測試錯誤地表明序列是平穩的

為什麼 AIC 沒有報告置信區間？

為什麼要執行時間序列分解

隨機遊走的直覺具有恆定的平均值