Model-Selection

如何在AIC的基礎上比較模型?

  • August 30, 2016

我們有兩個模型使用相同的方法來計算對數似然度,一個模型的 AIC 低於另一個模型。然而,具有較低 AIC 的那個則更難解釋。

我們很難決定是否值得引入這個難度,我們使用 AIC 的百分比差異來判斷這一點。我們發現兩個 AIC 之間的差異僅為 0.7%,更複雜的模型的 AIC 低 0.7%。

  1. 兩者之間的低百分比差異是否是避免使用具有較低 AIC 的模型的好理由?
  2. 差異百分比是否解釋了在不太複雜的模型中丟失了 0.7% 以上的信息?
  3. 這兩個模型能有非常不同的結果嗎?

一個不比較兩個 AIC 的絕對值(可以像但是也),但考慮到它們的區別

在哪裡是 AIC 的-th 模型,和是在檢查的一組模型(即首選模型)中獲得的最低 AIC。例如在Burnham & Anderson 2004中概述的經驗法則是:

  1. 如果,那麼就得到了很大的支持-th 模型(或反對它的證據只值得一提),並且它是一個適當的描述的命題是很可能的;
  2. 如果, 那麼就有了強烈的支持-第模型;
  3. 如果,那麼對-第模型;
  4. 型號與基本沒有支持。

現在,關於問題中提到的 0.7%,考慮兩種情況:

  1. 和增大 0.7%:. 然後因此模型之間沒有實質性差異。
  2. 和增大 0.7%:. 然後所以不支持 2-nd 模型。

因此,說 AIC 之間的差異為 0.7% 並不能提供任何信息。

AIC 值包含來自對數似然的縮放常數 , 所以沒有這樣的常數。有人可能會考慮重新調整轉換,迫使最佳模型具有.

AIC 的公式會懲罰使用過多參數,因此不鼓勵過度擬合。它更喜歡參數較少的模型,只要其他模型不能提供更好的擬合。AIC 試圖選擇一個模型(在被檢查的模型中)最充分地描述現實(以被檢查的數據的形式)。這意味著實際上從未考慮過作為數據真實描述的模型。請注意,AIC 為您提供哪種模型更好地描述數據的信息,它不提供任何解釋

就個人而言,我會說,如果您有一個簡單的模型和一個具有更低 AIC 的複雜模型,那麼簡單的模型還不夠好。如果更複雜的模型真的復雜得多,但是不是很大(也許, 或許- 取決於具體情況)如果它真的更容易使用,我會堅持使用更簡單的模型。

此外,您可以將概率歸因於-th 模型通過

它提供了一個親戚(相比) 概率-th 模型最小化 AIC。例如,對應於(相當高),和對應於(很低)。第一種情況意味著有 47% 的概率-th 模型實際上可能比產生的模型更好的描述,在第二種情況下,這個概率只有 0.05%。

最後,關於 AIC 的公式:

需要注意的是,當兩個具有相似被認為是僅取決於參數的數量,因為學期。因此,當,相對改進是由於擬合的實際改進,而不僅僅是增加參數的數量。

TL;博士

  1. 這是一個不好的理由;使用 AIC 絕對值之間的差值。
  2. 百分比什麼也沒說。
  3. 由於沒有關於模型、數據以及不同結果意味著什麼的信息,無法回答這個問題。

引用自:https://stats.stackexchange.com/questions/232465

comments powered by Disqus