Kaplan-Meier 曲線似乎與 Cox 回歸不同
在 R 中,我正在對癌症患者進行生存數據分析。
我一直在 CrossValidated 和其他地方閱讀有關生存分析的非常有用的內容,並認為我了解如何解釋 Cox 回歸結果。但是,一個結果仍然困擾著我……
我正在比較生存與性別。Kaplan-Meier 曲線明顯有利於女性患者(我多次檢查我添加的圖例是正確的,存活時間最長的患者,4856 天,確實是女性):
Cox 回歸正在回歸:
Call: coxph(formula = survival ~ gender, data = Clinical) n= 348, number of events= 154 coef exp(coef) se(coef) z Pr(>|z|) gendermale -0.3707 0.6903 0.1758 -2.109 0.035 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 exp(coef) exp(-coef) lower .95 upper .95 gendermale 0.6903 1.449 0.4891 0.9742 Concordance= 0.555 (se = 0.019 ) Rsquare= 0.012 (max possible= 0.989 ) Likelihood ratio test= 4.23 on 1 df, p=0.03982 Wald test = 4.45 on 1 df, p=0.03499 Score (logrank) test = 4.5 on 1 df, p=0.03396
因此,男性患者 ( ) 的危險比 (HR) 為
gendermale
0.6903。我的解釋方式(不看 Kaplan-Meier 曲線)是:由於 HR <1,作為男性患者俱有保護性。或者更準確地說,女性患者在任何特定時間死亡的可能性比男性高 1/0.6903 = exp(-coef) = 1.449。但這似乎不像 Kaplan-Meier 曲線所說的那樣!我的解釋有什麼問題?
這是非比例風險或生存分析中“耗盡”影響的一個很好的例子。我會盡力解釋。
首先仔細看看你的 Kaplan-Meier (KM) 曲線:你可以看到在第一部分(直到大約 3000 天),在時間 t 處於危險中的人口中仍然活著的男性比例大於女性的比例(即藍線比紅線“高”)。這意味著男性確實對所研究的事件(死亡)具有“保護性”。因此,風險比應在 0 和 1 之間(並且係數應為負)。
然而,在 3000 天之後,紅線更高!這確實表明了相反的情況。僅基於此 KM 圖,這將進一步表明非比例風險。在這種情況下,“非比例”意味著您的自變量(性別)的影響隨著時間的推移不是恆定的。換句話說,風險比隨著時間的推移而變化是可行的。如上所述,情況似乎如此。常規比例風險 Cox 模型不適應這種影響。實際上,主要假設之一是風險是成比例的!現在您實際上也可以對非比例風險進行建模,但這超出了此答案的範圍。
還有一個額外的評論:這種差異可能是由於真正的危險是不成比例的或事實上,KM 曲線的尾部估計存在很大差異。請注意,此時,總共 348 名患者將下降到仍然處於危險之中的極少數人群。如您所見,兩個性別組都有經歷事件的患者和被審查的患者(垂直線)。隨著處於危險中的人口減少,生存估計將變得不太確定。如果您在 KM 線周圍繪製了 95% 的置信區間,您會看到置信區間的寬度在增加。這對於評估危險也很重要。簡而言之,由於您研究的最後階段處於風險中的人群和事件數量較低,因此該階段對您初始 cox 模型中的估計值的貢獻較小。
最後,這將解釋為什麼危險(假設隨著時間的推移保持不變)更符合 KM 的第一部分,而不是最終端點。
編輯:請參閱@Scrotchi 對原始問題的即時評論:如前所述,研究最後階段數字低的影響是這些時間點的危害估計是不確定的。因此,您也不太確定明顯違反比例風險假設是否不是偶然的。正如@ scrotchi 所說,PH 假設可能沒有那麼糟糕。