Generalized-Estimating-Equations
GEE:選擇合適的工作相關結構
我是一名流行病學家,試圖了解 GEE 以便正確分析隊列研究(使用帶有對數鏈接的泊松回歸來估計相對風險)。我有一些關於“工作相關性”的問題,我希望有更博學的人來澄清:
(1) 如果我對同一個人進行了多次測量,通常假設一個可交換結構是最合理的嗎?(或者如果測量顯示趨勢,則為自回歸)?獨立性怎麼樣 - 是否有任何情況下可以假設同一個人的測量獨立性?
(2) 是否有任何(相當簡單的)方法可以通過檢查數據來評估適當的結構?
(3) 我注意到,在選擇獨立結構時,我得到的點估計值(但標準誤差更低)與運行簡單泊松回歸(使用 R、函數
glm()
和geeglm()
from packagegeepack
)時相同。為什麼會這樣?我知道使用 GEE,您可以估計人口平均模型(與特定主題相反),因此您應該僅在線性回歸情況下獲得相同的點估計。(4) 如果我的隊列位於多個地點(但每個人進行一次測量),我應該選擇獨立的還是可交換的工作相關性,為什麼?我的意思是,每個站點中的個人仍然相互獨立,對嗎?因此,例如,對於特定於主題的模型,我會將站點指定為隨機效應。然而,對於 GEE,獨立性和可交換性給出了不同的估計,我不確定哪一個在基本假設方面更好。
(5) GEE 能否處理 2 級層次聚類,即每個個體重複測量的多站點隊列?如果是,我應該指定什麼作為聚類變量,
geeglm()
如果假設第一級(站點)為“獨立”,第二級(個人)為“可交換”或“自回歸”,那麼工作相關性應該是什麼?我知道這些問題很多,其中一些可能是相當基本的,但對我(也許還有其他新手?)來說仍然很難掌握。因此,非常感謝您的任何幫助,為了表明這一點,我開始了賞金活動。
- 不必要。對於小集群、不平衡設計和不完整的集群內混雜因素調整,可交換相關性可能比獨立 GEE 效率低下且相對偏倚。這些假設也可能相當強大。但是,當滿足這些假設時,您可以通過可交換獲得更有效的推理。我從來沒有發現 AR-1 相關結構有意義的例子,因為在時間上平衡的測量是不常見的(我使用人類受試者數據)。
- 好吧,探索相關性很好,應該在數據分析中完成。但是,它真的不應該指導決策。您可以使用變異函數和 lorellograms 來可視化縱向和麵板研究中的相關性。集群內相關性是集群內相關程度的一個很好的衡量標準。
- GEE 中的相關結構與混合模型不同,不會影響邊際參數估計值(您正在使用 GEE 進行估計)。不過,它確實會影響標準誤差估計。這與任何鏈接功能無關。GEE 中的鏈接功能是針對邊緣模型的。
- 站點可能是無法測量的變化的來源,例如嘴裡的牙齒或學區內的學生。這些數據中可能存在集群級別的混雜因素,例如蛀牙的遺傳傾向或社區教育資金,因此,您將通過使用可交換的相關結構獲得更好的標準誤差估計。
- GEE 中邊際效應的計算在不嵌套時很複雜,但可以做到。嵌套很容易,你就照你說的做。