ICC 與同一組中兩個隨機抽取的單元之間的預期相關性

May 4, 2016

在多級建模中，通常從隨機效應方差分析中計算出類內相關性

在哪裡是 2 級殘差和是一級殘差。然後我們得到估計，和對於方差和分別，並將它們代入以下等式：

Hox (2002)在 p15上寫道

類內相關性 ρ 也可以解釋為同一組中兩個隨機抽取的單元之間的預期相關性

這裡有一個問題，它提出了一個高級問題（為什麼它完全等於這個而不是近似等於）並得到一個高級答案。

但是，我想問一個更簡單的問題。

**問題：**談論同一組中兩個隨機抽取的單位之間的相關性甚至意味著什麼？

我對類內相關性適用於組而不是配對數據這一事實有一個基本的了解。但是，如果我們只有來自同一組的兩個隨機抽取的單元，我仍然不明白如何計算相關性。例如，如果我查看ICC 維基百科頁面上的點圖，我們有多個組和每個組內的多個點。

如果您考慮每組只有兩個人的情況，則可能最容易看到等價性。所以，讓我們看一個具體的例子（我會用 R 來做這個）：
dat <- read.table(header=TRUE, text = "
group person   y
1     1        5
1     2        6
2     1        3
2     2        2
3     1        7
3     2        9
4     1        2
4     2        2
5     1        3
5     2        5
6     1        6
6     2        9
7     1        4
7     2        2
8     1        8
8     2        7")
所以，我們有 8 組，每組 2 個人。現在讓我們擬合隨機效應方差分析模型：
library(nlme)
res <- lme(y ~ 1, random = ~ 1 | group, data=dat, method="ML")
最後，讓我們計算 ICC：
getVarCov(res)[1] / (getVarCov(res)[1] + res$sigma^2)
這產生：（0.7500003準確地說是 0.75，但這裡的估計過程中有一些輕微的數字印象）。

現在讓我們將數據從長格式重塑為寬格式：
dat <- as.matrix(reshape(dat, direction="wide", v.names="y", idvar="group", timevar="person"))
現在看起來像這樣：
  group y.1 y.2
1      1   5   6
3      2   3   2
5      3   7   9
7      4   2   2
9      5   3   5
11     6   6   9
13     7   4   2
15     8   8   7
現在計算和之間的相關y.1性y.2：
cor(dat[,2], dat[,3])
這產生：0.8161138

等等，什麼？這裡發生了什麼？不應該是0.75嗎？不完全的！我上面計算的不是 ICC（類內相關係數），而是常規的 Pearson 積矩相關係數，這是一個類間相關係數。請注意，在長格式數據中，誰是人 1 和誰是人 2 完全是任意的——這些對是無序的。您可以重新排列組內的數據，您會得到相同的結果。y.1但在寬格式數據中，誰列在下面，誰列在下面並不是任意的y.2。如果你要切換一些個體，你會得到不同的相關性（除非你要切換所有個體——那麼這相當於cor(dat[,3], dat[,2])這當然仍然給你0.8161138）。

費舍爾指出的是用寬格式數據獲取 ICC 的一個小技巧。將每對按兩個順序包含兩次，然後計算相關性：
dat <- rbind(dat, dat[,c(1,3,2)])
cor(dat[,2], dat[,3])
這產生：0.75.

所以，正如你所看到的，ICC 實際上是一個相關係數——對於來自同一組的兩個人的“未配對”數據。

如果每個組有兩個以上的人，您仍然可以以這種方式考慮 ICC，除了在組內創建個人配對的方式會更多。然後，ICC 是所有可能配對之間的相關性（再次以無序的方式）。

引用自：https://stats.stackexchange.com/questions/210835

comments powered by Disqus

ICC 與同一組中兩個隨機抽取的單元之間的預期相關性

相關問答

如何估計相關觀測值的方差？

為什麼這個線性混合模型是奇異的？

為什麼不總是使用廣義估計方程 (GEE) 而不是線性混合模型？

“城市”應該是固定變量還是隨機效應變量？

固定效應的頻率論定義是什麼？

固定效應模型中的可變斜率