GEE：選擇合適的工作相關結構

January 28, 2014

我是一名流行病學家，試圖了解 GEE 以便正確分析隊列研究（使用帶有對數鏈接的泊松回歸來估計相對風險）。我有一些關於“工作相關性”的問題，我希望有更博學的人來澄清：

(1) 如果我對同一個人進行了多次測量，通常假設一個可交換結構是最合理的嗎？（或者如果測量顯示趨勢，則為自回歸）？獨立性怎麼樣 - 是否有任何情況下可以假設同一個人的測量獨立性？

(2) 是否有任何（相當簡單的）方法可以通過檢查數據來評估適當的結構？

(3) 我注意到，在選擇獨立結構時，我得到的點估計值（但標準誤差更低）與運行簡單泊松回歸（使用 R、函數glm()和geeglm()from package geepack）時相同。為什麼會這樣？我知道使用 GEE，您可以估計人口平均模型（與特定主題相反），因此您應該僅在線性回歸情況下獲得相同的點估計。

(4) 如果我的隊列位於多個地點（但每個人進行一次測量），我應該選擇獨立的還是可交換的工作相關性，為什麼？我的意思是，每個站點中的個人仍然相互獨立，對嗎？因此，例如，對於特定於主題的模型，我會將站點指定為隨機效應。然而，對於 GEE，獨立性和可交換性給出了不同的估計，我不確定哪一個在基本假設方面更好。

(5) GEE 能否處理 2 級層次聚類，即每個個體重複測量的多站點隊列？如果是，我應該指定什麼作為聚類變量，geeglm()如果假設第一級（站點）為“獨立”，第二級（個人）為“可交換”或“自回歸”，那麼工作相關性應該是什麼？

我知道這些問題很多，其中一些可能是相當基本的，但對我（也許還有其他新手？）來說仍然很難掌握。因此，非常感謝您的任何幫助，為了表明這一點，我開始了賞金活動。

不必要。對於小集群、不平衡設計和不完整的集群內混雜因素調整，可交換相關性可能比獨立 GEE 效率低下且相對偏倚。這些假設也可能相當強大。但是，當滿足這些假設時，您可以通過可交換獲得更有效的推理。我從來沒有發現 AR-1 相關結構有意義的例子，因為在時間上平衡的測量是不常見的（我使用人類受試者數據）。

好吧，探索相關性很好，應該在數據分析中完成。但是，它真的不應該指導決策。您可以使用變異函數和 lorellograms 來可視化縱向和麵板研究中的相關性。集群內相關性是集群內相關程度的一個很好的衡量標準。

GEE 中的相關結構與混合模型不同，不會影響邊際參數估計值（您正在使用 GEE 進行估計）。不過，它確實會影響標準誤差估計。這與任何鏈接功能無關。GEE 中的鏈接功能是針對邊緣模型的。

站點可能是無法測量的變化的來源，例如嘴裡的牙齒或學區內的學生。這些數據中可能存在集群級別的混雜因素，例如蛀牙的遺傳傾向或社區教育資金，因此，您將通過使用可交換的相關結構獲得更好的標準誤差估計。

GEE 中邊際效應的計算在不嵌套時很複雜，但可以做到。嵌套很容易，你就照你說的做。

引用自：https://stats.stackexchange.com/questions/83577

comments powered by Disqus

GEE：選擇合適的工作相關結構

相關問答