R

Kaplan-Meier 曲線似乎與 Cox 回歸不同

  • June 15, 2017

在 R 中,我正在對癌症患者進行生存數據分析。

我一直在 CrossValidated 和其他地方閱讀有關生存分析的非常有用的內容,並認為我了解如何解釋 Cox 回歸結果。但是,一個結果仍然困擾著我……

我正在比較生存與性別。Kaplan-Meier 曲線明顯有利於女性患者(我多次檢查我添加的圖例是正確的,存活時間最長的患者,4856 天,確實是女性): 在此處輸入圖像描述

Cox 回歸正在回歸:

Call:
coxph(formula = survival ~ gender, data = Clinical)

 n= 348, number of events= 154 

             coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

          exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

因此,男性患者 ( ) 的危險比 (HR) 為gendermale0.6903。我的解釋方式(不看 Kaplan-Meier 曲線)是:由於 HR <1,作為男性患者俱有保護性。或者更準確地說,女性患者在任何特定時間死亡的可能性比男性高 1/0.6903 = exp(-coef) = 1.449。

但這似乎不像 Kaplan-Meier 曲線所說的那樣!我的解釋有什麼問題?

這是非比例風險或生存分析中“耗盡”影響的一個很好的例子。我會盡力解釋。

首先仔細看看你的 Kaplan-Meier (KM) 曲線:你可以看到在第一部分(直到大約 3000 天),在時間 t 處於危險中的人口中仍然活著的男性比例大於女性的比例(即藍線比紅線“高”)。這意味著男性確實對所研究的事件(死亡)具有“保護性”。因此,風險比應在 0 和 1 之間(並且係數應為負)。

然而,在 3000 天之後,紅線更高!這確實表明了相反的情況。僅基於此 KM 圖,這將進一步表明非比例風險。在這種情況下,“非比例”意味著您的自變量(性別)的影響隨著時間的推移不是恆定的。換句話說,風險隨著時間的推移而變化是可行的。如上所述,情況似乎如此。常規比例風險 Cox 模型不適應這種影響。實際上,主要假設之一是風險是成比例的!現在您實際上也可以對非比例風險進行建模,但這超出了此答案的範圍。

還有一個額外的評論:這種差異可能是由於真正的危險是不成比例的事實上,KM 曲線的尾部估計存在很大差異。請注意,此時,總共 348 名患者將下降到仍然處於危險之中的極少數人群。如您所見,兩個性別組都有經歷事件的患者和被審查的患者(垂直線)。隨著處於危險中的人口減少,生存估計將變得不太確定。如果您在 KM 線周圍繪製了 95% 的置信區間,您會看到置信區間的寬度在增加。這對於評估危險也很重要。簡而言之,由於您研究的最後階段處於風險中的人群和事件數量較低,因此該階段對您初始 cox 模型中的估計值的貢獻較小。

最後,這將解釋為什麼危險(假設隨著時間的推移保持不變)更符合 KM 的第一部分,而不是最終端點。

編輯:請參閱@Scrotchi 對原始問題的即時評論:如前所述,研究最後階段數字低的影響是這些時間點的危害估計是不確定的。因此,您也不太確定明顯違反比例風險假設是否不是偶然的。正如@ scrotchi 所說,PH 假設可能沒有那麼糟糕。

引用自:https://stats.stackexchange.com/questions/285468

comments powered by Disqus