Time-Series

什麼時候適合通過最小化 AIC 來選擇模型?

  • December 8, 2013

至少在一些更高水平的統計學家中,AIC 統計量值在最小值的某個閾值內的模型應該被認為是最小化 AIC 統計量的模型是合適的。例如,在 [1, p.221] 我們發現

那麼具有小 GCV 或 AIC 的模型將被認為是最好的。當然,不應該只是盲目地最小化 GCV 或 AIC。相反,所有具有相當小的 GCV 或 AIC 值的模型都應被視為可能合適,並根據其簡單性和科學相關性進行評估。

同樣,在 [2, p.144] 我們有

有人建議 (Duong, 1984) AIC 值在最小值 c 內的模型應被視為具有競爭力(c=2 作為典型值)。然後可以根據殘差的白度(第 5.3 節)和模型簡單性等因素從競爭模型中進行選擇。

參考:

  1. 魯珀特,D。Wand,MP & Carrol,RJ半參數回歸,劍橋大學出版社,2003
  2. Brockwell, PJ & Davis, RA時間序列和預測簡介,John Wiley & Sons,1996

那麼鑑於上述情況,應該首選以下兩種模型中的哪一種?

print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787:  log likelihood = -27.09,  aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975:  log likelihood = -29.38,  aic = 64.76

更一般地說,什麼時候適合通過盲目地最小化 AIC 或相關統計量來選擇模型?

套用 Cosma Shalizi關於線性回歸真相的講義,*你永遠不能僅僅因為它碰巧最小化了像 AIC 這樣的統計量而選擇模型,*因為

每當有人單獨使用 AIC 統計量進行模型選擇時,天使就會失去翅膀。每當有人輕率地貶低它時,天使不僅失去了翅膀,而且被逐出天堂,在最極端的痛苦中墜入永恆的火中。

引用自:https://stats.stackexchange.com/questions/78949

comments powered by Disqus