Survival
對於配對數據的 Cox 比例風險,我應該使用哪種模型?
我希望有人可以幫助我了解我應該為我的數據使用哪種模型(脆弱、分層或集群)。我有配對數據,因此在對 Cox PH 建模時需要考慮到這一點,並且不確定哪個模型會給我更準確的結果。
我的研究正在研究一個人在受到特定刺激後變得平靜所需的時間。每個人在不同的日子受到兩種不同的刺激。他們被隨機分配哪個刺激是第一個。我已經使用生存分析(事件發生時間)對此進行了建模,但我現在需要考慮數據是配對的。
關於何時使用脆弱、分層或集群模型的任何幫助都會很棒。
該主題由許多論文涵蓋,包括:
以下是對兩種方法之間差異的非常簡短(且非詳盡)的總結。
分層方法
對於每一對,都有一個未指定的基線風險函數。通過將特定於每個層的部分可能性相乘,可以很容易地適應部分可能性的想法。
優點:
- 缺乏結構。
缺點:
- 它不提供關於對之間異質性的任何信息;
- 兩個成員共享相同協變量信息或僅提供刪失觀察的配對對可能性沒有貢獻;這是因為沒有嘗試進行對間比較。
脆弱的方法
對內關聯是由來自同一對的兩個成員共同的隨機效應來解釋的。因此,每對再次存在不同的基線危險,但它們並非完全未指定;有一些結構。估計基於邊際似然。
優點:
- 簡約性:異質性由單個參數描述;
- 有關於異質性的總結措施(了解異質性…);
- 可以研究對中常見變量的影響。
缺點:
- 軟件可用性(在 R 中,您可以查看
coxph()
或parfm()
;在 SAS 中,您可以查看proc phreg
);- 研究仍在進行中。
作為結論,選擇取決於您的研究。但是,列表中的最後一個參考給出了一些指導:
對於組大小為 5 或更大的情況,很難證明使用隨機效應模型而不是分層模型是合理的,後一種模型更容易實施。對於少於五人的小組,情況會發生變化,特別是對於雙胞胎研究,效率提升是如此之大,以至於我們更願意使用隨機效應模型而不是分層模型。分層模型仍然有效,但可能需要多 20% 到 30% 的觀測值才能達到相同的精度。