如何評估生存函數的擬合優度
我是生存分析的新手,雖然我對分類和回歸有一些了解。
對於回歸,我們有 MSE 和 R 平方統計量。但是,除了某種圖形(KM 曲線)之外,我們怎麼能說生存模型 A 優於生存模型 B?
如果可能,請舉例說明區別(例如,R 中的 rpart 包)。您如何證明一棵 CART 生存樹優於另一棵 CART 生存樹?可以使用哪些指標?
像 Cox 模型這樣的統計數據的主要問題(在另一個答案中描述)是它非常依賴於數據的審查分佈。您可能會看到的其他自然事物,例如與空模型的似然比,也存在此問題。(這基本上是因為刪失數據點對可能性的貢獻與觀察事件的數據點的貢獻非常不同,因為其中一個來自 PDF,另一個來自 CDF。)各種研究人員已經提出了解決這個問題的方法,但我看到的那些通常要求你有一個審查分佈的模型或同樣不切實際的東西。我還沒有研究過這種依賴性在實踐中有多嚴重,所以如果你的審查相當溫和,你仍然可以研究基於似然比的統計數據。對於生存 CART 模型,
對於通用生存模型,一個常用的統計數據是 Harrell 的c指數,類似於 Kendall 的或生存模型的 ROC AUC。從本質上講,c是在您知道一個實例比另一個更晚經歷事件的所有實例中,模型正確排名的比例。(也就是說,這裡的分母中要包含一對實例,最多可以刪減一個,並且必須在另一個經歷事件後進行刪失。) c指數也取決於審查分佈,但根據 Harrell 的說法,這種依賴性比我上面提到的其他統計數據要溫和。不幸的是,哈雷爾的c也沒有上述統計數據那麼敏感,因此如果它們之間的差異很小,您可能不想在基於它的模型之間進行選擇;它作為一般性能的可解釋指標比比較不同模型的方法更有用。
(最後,當然,如果您對模型有特定的目的——也就是說,如果你知道你的預測損失函數是什麼——你總是可以根據損失函數來評估它們!但我猜你沒那麼幸運……)
要更深入地討論似然比統計和 Harrell’s c,您應該查看 Harrell 的優秀教科書Regression Modeling Strategies。關於評估生存模型的部分是 §19.10,第 492-493 頁。對不起,我不能給你一個明確的答案,但我不認為這是一個已解決的問題!