什麼時候適合通過最小化 AIC 來選擇模型？

December 8, 2013

至少在一些更高水平的統計學家中，AIC 統計量值在最小值的某個閾值內的模型應該被認為是最小化 AIC 統計量的模型是合適的。例如，在 [1, p.221] 我們發現

那麼具有小 GCV 或 AIC 的模型將被認為是最好的。當然，不應該只是盲目地最小化 GCV 或 AIC。相反，所有具有相當小的 GCV 或 AIC 值的模型都應被視為可能合適，並根據其簡單性和科學相關性進行評估。

同樣，在 [2, p.144] 我們有

有人建議 (Duong, 1984) AIC 值在最小值 c 內的模型應被視為具有競爭力（c=2 作為典型值）。然後可以根據殘差的白度（第 5.3 節）和模型簡單性等因素從競爭模型中進行選擇。

參考：

魯珀特，D。Wand，MP & Carrol，RJ半參數回歸，劍橋大學出版社，2003

Brockwell, PJ & Davis, RA時間序列和預測簡介，John Wiley & Sons，1996

那麼鑑於上述情況，應該首選以下兩種模型中的哪一種？
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787:  log likelihood = -27.09,  aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975:  log likelihood = -29.38,  aic = 64.76
更一般地說，什麼時候適合通過盲目地最小化 AIC 或相關統計量來選擇模型？

套用 Cosma Shalizi關於線性回歸真相的講義，*你永遠不能僅僅因為它碰巧最小化了像 AIC 這樣的統計量而選擇模型，*因為

每當有人單獨使用 AIC 統計量進行模型選擇時，天使就會失去翅膀。每當有人輕率地貶低它時，天使不僅失去了翅膀，而且被逐出天堂，在最極端的痛苦中墜入永恆的火中。

引用自：https://stats.stackexchange.com/questions/78949

comments powered by Disqus

什麼時候適合通過最小化 AIC 來選擇模型？

相關問答

為什麼 AIC 沒有報告置信區間？

當我們繪製數據然後在回歸模型中使用非線性變換時，我們是否在窺探數據？

我們想遠離意義嗎？

通過選擇聚合數據來解決辛普森悖論的示例

我什麼時候應該使用驗證而不是交叉驗證

R中GAM的模型選擇