Regression

ICC在多級建模中的使用

  • August 17, 2016

我最近剛開始學習 ICC 和多級模型,有人告訴我,確定 MLM 是否有必要的一種方法是檢查 ICC 的大小。我很難理解為什麼 ICC 是您是否應該運行 MLM 的一個很好的指標

據我了解,ICC 告訴您集群/組之間有多少可變性。如果 ICC 很大,那麼您的集群之間會有很多變化,您應該分別對待它們,允許隨機截距或隨機斜率

如果您對運行隨機截距模型感興趣,我可以理解為什麼 ICC 可能有用。集群之間的高度可變性可能表明它們具有不同的均值和可能不同的截距,因此我們運行一個 MLM,它允許每個集群有不同的截距

但是 ICC 是否告訴您有關每個集群的不同斜率的可能性?我不能完全理解斜率與 ICC 返回的值之間的關係。如果 ICC 很小,則意味著集群之間的變異性很小,這可能表明它們的均值相似,因此可能不需要隨機截距模型,但這是否自動意味著隨機斜率模型也不需要?

ICC(類內相關)對於隨機截距模型是可解釋和有用的。它是同一簇內的兩個觀測值之間的相關性。集群內的相關性越高(即 ICC 越大),集群內的變異性越低,因此集群**之間的變異性就越高。

或者,它也是衡量每個級別有多少變化的量度,這就是為什麼它也被稱為方差分配係數 (VPC)。

因此,正如您正確指出的那樣,在隨機截距模型中,當 ICC 很大時,這是有利於保留隨機截距的證據,而當它很小時,這是有利於丟棄隨機截距的證據。然而,正如應用統計中經常出現的情況一樣,決定“小”和“大”的因素是特定於上下文和特定學科的。

一旦我們引入隨機斜率/係數,事情就會變得更加複雜。ICC 不再與 VPC 相同,因為 ICC 將是指定隨機斜率的變量的函數。因此,如果所討論的變量是連續的,ICC 的值可以是無限數量的,如果它是分類的或計數的,則與級別的數量一樣多。因此,在隨機斜率模型中對 ICC 的任何解釋都變得更加困難。例如,Stata 將為 ICC 計算單個值,但在隨機斜率模型中,這伴隨著警告:

注意:ICC 以隨機效應協變量的零值為條件。

換句話說,它已經根據隨機斜率變量的零值計算了 ICC,因此對 ICC 的任何解釋也基於斜率變量的零值。

關於你的問題:

如果 ICC 很小,則意味著集群之間的變異性很小,這可能表明它們的均值相似,因此可能不需要隨機截距模型,但這是否自動意味著隨機斜率模型也不需要?

不,因為每個集群有可能具有相同的截距(沒有隨機截距),而斜率確實可能不同,我們可以像這樣可視化:

在此處輸入圖像描述

如果我們想知道數據是否支持隨機斜率,一種方法是擬合具有和不具有隨機斜率的模型,並使用似然比檢驗。

引用自:https://stats.stackexchange.com/questions/230214

comments powered by Disqus