References

生存分析(Cox 回歸)中不同類型的殘差有什麼區別?

  • August 13, 2017

我對生存分析相當陌生。我被建議查找並學習 Schoenfeld 殘差作為模型診斷的一部分,以查看是否滿足比例風險假設。在查找此內容時,我看到了對許多不同類型殘差的引用,包括:

  • 考克斯內爾
  • 偏差
  • 分數
  • 勳費爾德

這些殘差之間有什麼區別,何時建議使用一個而不是另一個?(我很高興答案只是指向要閱讀的論文的鏈接。)

Cox-Snell 殘差 $ r_{Ci} $ , 用於評估模型的擬合優度。通過繪製 Cox-Snell 殘差與累積風險函數的關係,可以評估模型的擬合度。一個擬合良好的模型將呈現一條通過原點的線性線,具有單位梯度。應該注意的是,Cox-Snell 殘差需要一個特別不合適的模型才能顯著偏離這一點。在圖表的末端看到一些輕微的跳躍也很常見。對 Cox-Snell 殘差的一個批評是它們沒有考慮刪失的觀察結果,因此 Crowley & Hu (1977) 設計了調整後的 Cox-Snell 殘差,其中標準 Cox-Snell 殘差, $ r_{Ci} $ 可用於未經審查的觀察和 $ r_{Ci} + \Delta $ 藉此 $ \Delta = \log (2) = 0.693 $ , 用於調整殘差。

鞅殘差 $ r_{Mi} $ 可以定義為 $ r_{Mi} = \delta_i - r_{Ci} $ 在哪裡 $ \delta_i $ 是一個開關,如果觀察值為 0 $ i $ 被審查,如果觀察則為 1 $ i $ 未經審查。鞅殘差取值之間 $ [1, - \infty] $ 對於未經審查的觀察和 $ [0,- \infty] $ 審查意見。鞅殘差可用於評估特定協變量的真實函數形式 (Thernau et al. (1990))。在該圖上覆蓋 LOESS 曲線通常很有用,因為它們在具有大量觀察值的圖中可能會很嘈雜。鞅殘差也可用於評估數據集中的異常值,倖存者函數預測事件太早或太晚,但是,為此使用偏差殘差通常更好。

偏差殘差, $ r_{Di} = sgn(r_{Mi})\sqrt{-2 r_{Mi} + \delta_i \log{(\delta_i-r_{Mi})}} $ 在哪裡 $ sgn $ 正鞅殘差取值為 1,負鞅殘差取值為 -1。高絕對值的殘差表示異常值。正值偏差殘差表示觀察到事件發生的時間比預測的要早;對於負值殘差,反之亦然。與 Martingale 殘差不同,偏差殘差的均值以 0 為中心,在尋找異常值時,它們比 Martingale 殘差更容易解釋。偏差殘差的一種應用是僅使用一個建模參數對數據集進行折刀,並在刪除每個觀察值時測試參數係數的顯著差異。一個顯著的變化將表明一個非常有影響力的觀察。

Schoenfeld 殘差略有不同,因為每個殘差對應一個變量,而不是一個觀察值。使用 Schoenfeld 殘差是為了檢驗比例風險假設。Grambsch 和 Thernau (1994) 提出縮放 Schoenfeld 殘差可能更有用。通過針對每個變量的 Schoenfeld 殘差繪製事件時間,可以通過將 LOESS 曲線擬合到圖中來評估變量是否符合 PH 假設。一條通過殘差值為 0 且梯度為 0 的直線表示該變量滿足 PH 假設,因此不依賴於時間。Schoenfeld 殘差也可以通過假設檢驗來評估。

引用自:https://stats.stackexchange.com/questions/297740

comments powered by Disqus