Epidemiology

在 ROC 曲線分析中調整協變量

  • October 2, 2010

這個問題是關於在存在相關量表的情況下估計多維篩選問卷的截止分數以預測二元終點。

我被問及在設計可能用於酒精中毒篩查的測量量表(人格特徵)的每個維度的截止分數時控制相關子分數的興趣。也就是說,在這種特殊情況下,該人對調整外部協變量(預測變量)不感興趣——這會導致協變量調整的 ROC 曲線下的(部分)面積,例如(1-2)——但主要是其他分數來自同一份問卷,因為它們相互關聯(例如“衝動”與“尋求感覺”)。它相當於構建一個 GLM,其中包括左側的感興趣分數(我們尋求截止)和從同一問卷計算的另一個分數,而右側的結果可能是飲酒狀態。

為了澄清(根據@robin 請求),假設我們有分數,說(例如,焦慮、衝動、神經質、尋求感覺),我們想要找到一個臨界值(即“正面案例”如果, 否則為“否定情況”)對它們中的每一個。在設計此類截止值時(使用 ROC 曲線分析),我們通常會調整其他風險因素,例如性別或年齡。現在,既然已知 SS 與 IMP 相關,那麼如何調整性別、年齡和感覺尋求 (SS) 的衝動性 (IMP)?換句話說,我們將有一個 IMP 的截止值,其中年齡、性別和焦慮水平的影響被消除。

除了說截止必須盡可能簡單之外,我的回答是

關於協變量,我建議在調整和不調整的情況下估計 AUC,以查看預測性能是否提高。在這裡,您的協變量只是從同一測量工具定義的其他子分數,我從未遇到過這種情況(通常,我會根據已知的風險因素進行調整,如年齡或性別)。[…] 此外,由於您對預後問題(即問卷的篩查效果)感興趣,您可能還對估計提供的陽性預測值(PPV,陽性檢測結果被正確分類的患者的概率)感興趣您可以根據問卷中的子分數將主題分類為“正面”或“負面”。但是請注意,

您是否對這種特殊情況有更透徹的了解,並儘可能提供相關論文的鏈接?

參考

  1. Janes, H 和 Pepe, MS (2008)。調整診斷、篩查或預後標誌物研究中的協變量:新環境中的舊概念美國流行病學雜誌,168(1):89-97。
  2. Janes, H 和 Pepe, MS (2008)。在 ROC 分析中容納協變量華盛頓大學生物統計學工作論文系列,論文 322。

您設想的分析方式實際上並不是我建議您開始考慮它的方式。首先很容易證明,如果必須使用截止值,那麼截止值不是應用於單個特徵,而是應用於整體預測概率。單個協變量的最佳截止值取決於其他協變量的所有水平;它不可能是恆定的。其次,ROC 曲線在滿足為單個受試者做出最佳決策的目標方面沒有任何作用。

為了處理相關尺度,有許多數據縮減技術可以提供幫助。其中之一是正式的冗餘分析,其中每個預測器依次從所有其他預測器非線性預測。這是在redunRHmisc包中的函數中實現的。變量聚類、主成分分析和因子分析是其他可能性。但在我看來,分析的主要部分應該是建立一個好的概率模型(例如,二元邏輯模型)。

引用自:https://stats.stackexchange.com/questions/3259

comments powered by Disqus