不同的 AIC 定義
來自維基百科的 Akaike 信息準則 (AIC) 定義為, 在哪裡是參數的數量和是模型的對數似然。
然而,我們的計量經濟學在一所受人尊敬的大學指出,. 這裡是 ARMA 模型中誤差的估計方差,並且是時間序列數據集中的觀察數。
後一個定義是否等同於第一個,但只是針對 ARMA 模型進行了調整?或者這兩個定義之間是否存在某種衝突?
您從筆記中引用的公式並不完全是 AIC。
AIC 是.
在這裡,我將給出一個近似推導的大綱,它足以清楚地說明發生了什麼。
如果您有一個具有恆定方差的獨立正態誤差的模型,
可以在最大似然下估計為
(假設估計是 ML 估計)
所以(直到移動一個常數)
現在在 ARMA 模型中,如果相比起來真的很大和,那麼可能性可以通過這樣的高斯框架來近似(例如,您可以將 ARMA 近似地寫為更長的 AR 並在足夠的條件下將 AR 寫為回歸模型),所以代替:
因此
現在,如果您只是比較AIC,那麼除以根本不重要,因為它不會改變 AIC 值的順序。
但是,如果您將 AIC 用於其他依賴於 AIC 差異的實際值的目的(例如進行 Burnham 和 Anderson 所描述的多模型推理),那麼這很重要。
許多計量經濟學課本似乎都使用這種 AIC/T 形式。奇怪的是,有些書似乎引用了 Hurvich 和 Tsai 1989 或 Findley 1985 的這種形式,但 Hurvich & Tsai 和 Findley 似乎在討論原始形式(儘管我只是間接表明 Findley 現在做了什麼,所以也許有芬德利的東西就可以了)。
進行這種縮放可能有多種原因——例如,時間序列,尤其是高頻時間序列,可能非常長,而普通 AIC 可能會變得笨拙,尤其是如果非常小。(還有一些其他可能的原因,但由於我真的不知道這樣做的原因,我不會開始列出所有可能的原因。)
您可能想查看 Rob Hyndman 的AIC 事實和謬誤列表,尤其是第 3 到 7 項。其中一些要點可能會讓您至少對過度依賴高斯似然近似值持謹慎態度,但是也許有比我在這裡提供的更好的理由。
我不確定是否有充分的理由使用這種對數似然的近似值而不是實際的 AIC,因為現在很多時間序列包都傾向於計算(/最大化)ARMA 模型的實際對數似然。似乎沒有理由不使用它。