Survival
非比例危害的建議
這是一個困擾我很久的問題,我在教科書、谷歌或 Stack Exchange 中都沒有找到好的答案。
我有超過 100,000 名患者的數據集,正在比較四種治療方法。研究問題是在調整了一堆臨床/人口變量後,這些治療之間的生存率是否不同。未調整的 KM 曲線如下。
我使用的每種方法都顯示了非比例風險(例如,未調整的對數生存曲線以及與時間的相互作用以及 Schoenfield 殘差和排名生存時間的相關性,這些都是基於調整後的 Cox PH 模型)。對數生存曲線如下。如您所見,不成比例的形式是一團糟。雖然單獨進行兩組比較都不會太難處理,但我有六個比較的事實確實讓我感到困惑。我的猜測是,我無法在一個模型中處理所有事情。
我正在尋找有關如何處理這些數據的建議。考慮到比較的數量和不同形式的非比例性,使用擴展的 Cox 模型對這些影響進行建模可能是不可能的。鑑於他們對治療差異感興趣,整體分層模型不是一種選擇,因為它不允許我估計這些差異。
所以,請隨意撕裂我,但我正在考慮最初估計一個分層模型以獲得其他協變量的影響(當然,測試無交互假設),然後重新估計每個單獨的多變量 Cox 模型兩組比較(因此,總共 6 個模型)。這樣,我可以解決每個兩組比較的非比例形式,並獲得更少錯誤的估計 HR。我知道標準誤差會有偏差,但考慮到樣本量,一切都可能在“統計上”顯著。
奇妙的問題奇妙的答案。我要補充一點,您應該考慮一個模型做出許多不同的假設,例如對數正態生存模型。對 y_axis 使用正常的反函數而不是 log-log。仍然需要協變量調整。因此,還要查看按治療分層的殘差的正態性。這在我的課程筆記結束時的案例研究中有所介紹,網址為http://biostat.mc.vanderbilt.edu/rms