何時使用廣義估計方程與混合效應模型?
一段時間以來,我一直很高興地使用混合效應模型來處理縱向數據。我希望我能在 lmer 中適應 AR 關係(我認為我不能這樣做是對的?)但我認為這不是非常重要,所以我不用太擔心。
我剛剛遇到了廣義估計方程(GEE),它們似乎比 ME 模型提供了更多的靈活性。
冒著提出一個過於籠統的問題的風險,對於不同的任務哪個更好,有什麼建議嗎?我看過一些比較它們的論文,它們的形式往往是:
“在這個高度專業化的領域,不要對 X 使用 GEE,不要對 Y 使用 ME 模型”。
我還沒有找到任何更一般的建議。任何人都可以啟發我嗎?
謝謝!
當您有興趣發現協變量的總體平均效應與個體特定效應時,請使用 GEE。這兩件事僅在線性模型中等效,但在非線性模型中不等效(例如邏輯)。為了看到這一點,以隨機效應邏輯模型為例’第一次觀察’的主題,;
在哪裡是對象的隨機效應和.
如果您對這些數據使用隨機效應模型,那麼您將獲得這解釋了這樣一個事實,即平均零正態分佈擾動應用於每個個體,使其具有個體特異性。
如果您在這些數據上使用 GEE,您將估計總體平均對數機率。在這種情況下,那將是
, 一般來說。例如,如果和, 然後. 儘管隨機效應在轉換(或鏈接)尺度上的均值為零,但它們的效應在數據的原始尺度上並不是均值為零。嘗試從混合效應邏輯回歸模型中模擬一些數據,並將總體水平平均值與截距的逆 logit 進行比較,您會發現它們不相等,如本例所示。這種係數解釋的差異是 GEE 和隨機效應模型之間的根本差異。
**編輯:**一般來說,沒有預測變量的混合效應模型可以寫成
在哪裡是一個鏈接函數。每當
總體平均係數 (GEE) 和個體特定係數(隨機效應模型)之間會有差異。也就是說,平均值的變化是通過轉換數據,在轉換後的尺度上整合隨機效應,然後再轉換回來的。請注意,在線性模型中,(即),等式成立,所以它們是等價的。
**編輯 2:**同樣值得注意的是,GEE 模型產生的“穩健”三明治型標準誤差提供了有效的漸近置信區間(例如,它們實際上覆蓋了 95% 的時間),即使模型中指定的相關結構不是正確的。
**編輯 3:**如果您有興趣了解數據中的關聯結構,那麼 GEE 對關聯的估計是出了名的低效(有時甚至不一致)。我已經看到了這方面的參考,但現在無法放置。