關於混合模型中參數估計的直覺(方差參數與條件模式)
我讀過很多次,隨機效應(例如,受試者的 BLUP/條件模式)不是線性混合效應模型的參數,而是可以從估計的方差/協方差參數中得出。例如Reinhold Kliegl 等人。(2011)狀態:
隨機效應是受試者與總平均 RT 的偏差以及受試者與固定效應參數的偏差。它們被假定為獨立且正態分佈,均值為 0。重要的是要認識到這些隨機效應不是 LMM 的參數——只有它們的方差和協方差才是。[…] LMM 參數與受試者的數據相結合,可用於為每個受試者生成隨機效應的“預測”(條件模式)。
有人可以直觀地解釋如何在不實際使用/估計隨機效應的情況下估計隨機效應的(協)方差參數嗎?
考慮一個簡單的線性混合模型,例如一個隨機截距模型,我們估計在在不同的主題中,並假設每個主題都有自己的隨機截距:
這裡截取被建模為來自高斯分佈隨機噪聲也是高斯的在
lme4
語法中,此模型將寫為y ~ x + (1|subject)
. 將上面的內容改寫如下是有益的:這是指定相同概率模型的更正式的方式。從這個公式中,我們可以直接看到隨機效應不是“參數”:它們是未觀察到的隨機變量。那麼我們如何在不知道的值的情況下估計方差參數?
請注意,上面的第一個等式描述了條件分佈給定. 如果我們知道分佈和,那麼我們可以計算出無條件分佈通過整合. 你可能知道它是總概率定律。如果兩個分佈都是高斯分佈,那麼得到的無條件分佈也是高斯分佈。
在這種情況下,無條件分佈很簡單,但我們的觀察不是來自它的獨立同分佈樣本,因為每個受試者有多個測量值。為了繼續,我們需要考慮整體的分佈維向量在所有觀察中:
在哪裡是一個塊對角矩陣,由和. 你要求直覺,所以我想避免數學。重要的是這個方程沒有了!這就是實際適合觀察到的數據,這就是為什麼有人說不是模型的參數。 當參數,,, 和是合適的,可以計算出條件分佈對於每個. 您在混合模型輸出中看到的是這些分佈的模式,也就是條件模式。