Regression
為什麼信息標準(未調整R2R2R^2) 用於在時間序列模型中選擇適當的滯後順序?
在時間序列模型中,如 ARMA-GARCH,為了選擇模型的適當滯後或階數,使用了不同的信息準則,如 AIC、BIC、SIC 等。
我的問題很簡單,我們為什麼不使用調整選擇合適的型號?我們可以選擇導致調整值更高的模型. 因為兩者都調整了和信息標準對模型中額外數量的回歸器進行懲罰,其中前者懲罰然後懲罰似然值。
我認為至少在討論線性模型(如 AR 模型)時,已調整和AIC沒有什麼不同。
考慮是否應該包含在
這相當於比較模型
在哪裡. 我們說是真正的模型,如果. 請注意. 模型因此是嵌套的。模型選擇程序是一個依賴於數據的規則,它選擇幾個模型中最合理的。 我們說 是一致的,如果
考慮調整. 也就是說,選擇如果. 作為是單調遞減的,這個過程相當於最小化. 反過來,這相當於最小化. 對於足夠大, 後者可以寫成
在哪裡是誤差方差的 ML 估計量。選型依據因此漸近等價於選擇最小的模型 . 這個程序是不一致的。 命題:
證明:
其中倒數第二行是因為統計量是線性回歸情況下遵循漸近線的 LR 統計量零分佈。量子點 現在考慮 Akaike 的標準,
因此,AIC 還權衡了額外回歸變量所隱含的 SSR 減少與指向相反方向的“懲罰項”。因此,選擇如果 , 否則選擇. 可以看出,通過在第三行繼續上述證明也不一致. 調整後的和因此選擇“大”模型具有正概率,即使是真正的模型。
因為 AIC 中復雜性的懲罰比調整後的要大一些,但它可能不太容易過度選擇。它還有其他很好的特性(如果不在考慮的模型集中,則將 KL 散度最小化到真實模型),這些特性在我的帖子中沒有提到。