具有隨機斜率的混合模型中的類內相關係數
我有以下模型
m_plot
,其中包含參與者 ( ) 和項目 ( )lme4::lmer
的交叉隨機效應:lfdn``content
Random effects: Groups Name Variance Std.Dev. Corr lfdn (Intercept) 172.173 13.121 role1 62.351 7.896 0.03 inference1 24.640 4.964 0.08 -0.30 inference2 52.366 7.236 -0.05 0.17 -0.83 inference3 21.295 4.615 -0.03 0.22 0.86 -0.77 content (Intercept) 23.872 4.886 role1 2.497 1.580 -1.00 inference1 18.929 4.351 0.52 -0.52 inference2 14.716 3.836 -0.16 0.16 -0.08 inference3 17.782 4.217 -0.17 0.17 0.25 -0.79 role1:inference1 9.041 3.007 0.10 -0.10 -0.10 -0.21 0.16 role1:inference2 5.968 2.443 -0.60 0.60 -0.11 0.78 -0.48 -0.50 role1:inference3 4.420 2.102 0.30 -0.30 0.05 -0.97 0.71 0.37 -0.90 Residual 553.987 23.537 Number of obs: 3480, groups: lfdn, 435 content, 20
我想知道參與者和項目的類內相關係數 (ICC)。多虧了這個很好的答案,我原則上知道如何為我的模型獲取 ICC。但是,我不確定是否包括隨機斜率:
vars <- lapply(summary(m_plot)$varcor, diag) resid_var <- attr(summary(m_plot)$varcor, "sc")^2 total_var <- sum(sapply(vars, sum), resid_var) # with random slopes sapply(vars, sum)/total_var ## lfdn content ## 0.33822396 0.09880349 # only random intercepts: sapply(vars, function(x) x[1]) / total_var ## lfdn.(Intercept) content.(Intercept) ## 0.17496587 0.02425948
什麼是衡量同一參與者對同一項目的兩個響應之間相關性的適當度量?
基本上沒有單一的數字或估計可以總結隨機斜率模型中的聚類程度。
類內相關性 (ICC) 只能寫為僅隨機截距模型中方差的簡單比例。要了解原因,可以在此處找到 ICC 表達式推導的草圖。
當您將隨機斜率放入模型方程時,遵循相同的步驟會導致出現本文第 5 頁上的 ICC 表達式。如您所見,這個複雜的表達式是預測變量 X 的函數。要更直觀地了解為什麼 var(Y) 在存在隨機斜率時依賴於 X,請查看這些幻燈片的第 30 頁(“為什麼方差取決於 x ?”)。
因為 ICC 是預測變量(x 值)的函數,所以只能針對特定的 x 值集進行計算。您也許可以嘗試以 x 值的聯合平均值報告 ICC,但對於大多數觀察結果而言,這種估計顯然是不准確的。
我所說的一切仍然僅指存在單個隨機因素的情況。由於有多個隨機因素,它變得更加複雜。例如,在一個多站點項目中,每個站點的參與者對刺激樣本做出反應(即 3 個隨機因素:站點、參與者、刺激),我們可以詢問許多不同的 ICC:兩個響應之間的預期相關性是什麼在同一個地點,對相同的刺激,來自不同的參與者?在不同的地點、相同的刺激和不同的參與者怎麼樣?等等。@rvl 在 OP 鏈接到的答案中提到了這些並發症。
如您所見,我們可以用單個值總結聚類程度的唯一情況是單隨機因子 random-intercept-only 情況。因為這只是現實世界案例的一小部分,所以 ICC 在大多數情況下並不是那麼有用。所以我的一般建議是不要擔心它們。相反,我建議只報告方差分量(最好以標準偏差形式)。