Time-Series
什麼時候適合通過最小化 AIC 來選擇模型?
至少在一些更高水平的統計學家中,AIC 統計量值在最小值的某個閾值內的模型應該被認為是最小化 AIC 統計量的模型是合適的。例如,在 [1, p.221] 我們發現
那麼具有小 GCV 或 AIC 的模型將被認為是最好的。當然,不應該只是盲目地最小化 GCV 或 AIC。相反,所有具有相當小的 GCV 或 AIC 值的模型都應被視為可能合適,並根據其簡單性和科學相關性進行評估。
同樣,在 [2, p.144] 我們有
有人建議 (Duong, 1984) AIC 值在最小值 c 內的模型應被視為具有競爭力(c=2 作為典型值)。然後可以根據殘差的白度(第 5.3 節)和模型簡單性等因素從競爭模型中進行選擇。
參考:
- 魯珀特,D。Wand,MP & Carrol,RJ半參數回歸,劍橋大學出版社,2003
- Brockwell, PJ & Davis, RA時間序列和預測簡介,John Wiley & Sons,1996
那麼鑑於上述情況,應該首選以下兩種模型中的哪一種?
print( lh300 <- arima(lh, order=c(3,0,0)) ) # ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18 print( lh100 <- arima(lh, order=c(1,0,0)) ) # ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
更一般地說,什麼時候適合通過盲目地最小化 AIC 或相關統計量來選擇模型?
套用 Cosma Shalizi關於線性回歸真相的講義,*你永遠不能僅僅因為它碰巧最小化了像 AIC 這樣的統計量而選擇模型,*因為
每當有人單獨使用 AIC 統計量進行模型選擇時,天使就會失去翅膀。每當有人輕率地貶低它時,天使不僅失去了翅膀,而且被逐出天堂,在最極端的痛苦中墜入永恆的火中。