R

ROC 和 multiROC 分析:如何計算最佳切點?

  • August 16, 2013

我試圖了解如何計算 ROC 曲線的最佳切點(靈敏度和特異性最大化的值)。我正在使用aSAH包中的數據集pROC

outcome變量可以用兩個自變量來解釋:s100bndka。使用Epi包的語法,我創建了兩個模型:

library(pROC)
library(Epi)
ROC(form=outcome~s100b, data=aSAH)
ROC(form=outcome~ndka, data=aSAH)

輸出如下圖所示:

在此處輸入圖像描述 在此處輸入圖像描述

在第一張圖 ( s100b) 中,該函數表示最佳切割點位於對應於 的值處lr.eta=0.304。在第二張圖 ( ndka) 中,最佳切點位於對應的值lr.eta=0.335( 的含義是什麼lr.eta)。我的第一個問題是:

  • 所指示的值對應的s100bndka值是多少(關於和lr.eta的最佳切點是什麼)?s100b``ndka

第二個問題:

現在假設我創建了一個考慮到這兩個變量的模型:

ROC(form=outcome~ndka+s100b, data=aSAH)

得到的圖是:

在此處輸入圖像描述

我想知道ndkaAND的值是什麼,在該值下s100b,函數可以最大限度地提高敏感性和特異性。換句話說: Se=68.3%ndkas100bSp=76.4%(來自圖表的值)的值是多少?

我想這第二個問題與 multiROC 分析有關,但Epi包的文檔沒有解釋如何計算模型中使用的兩個變量的最佳切點。

我的問題似乎與reasearchGate的這個問題非常相似,簡而言之:

代表測量靈敏度和特異性之間更好權衡的截止分數的確定是直截了當的。但是,對於多變量 ROC 曲線分析,我注意到大多數研究人員都專注於算法來確定幾個指標(變量)的線性組合在 AUC 方面的整體準確性。[…]

然而,這些方法沒有提到如何確定與提供最佳診斷準確性的多個指標相關的截止分數的組合。

一個可能的解決方案是 Shultz 在他的論文中提出的,但是從這篇文章中我無法理解如何計算多元 ROC 曲線的最佳切點。

也許軟件包中的解決方案Epi並不理想,因此將不勝感激任何其他有用的鏈接。

為了詳細說明 Frank Harrell 的答案,該Epi軟件包所做的是擬合邏輯回歸,並製作具有以下形式的結果預測的 ROC 曲線:

在您的情況下,擬合值為(截距)= -2.379,(s100b) = 5.334 和(ndka) = 0.031。由於您希望預測結果為 0.312(“最佳”截止值),因此您可以將其替換為(希望我沒有在這裡引入錯誤):

或者:

任何滿足該等式的 (s100b, ndka) 值對都是“最優的”。祝你好運,這些對有無數個。例如,(0.29, 1)、(0, 51.2) 等。更糟糕的是,它們中的大多數都沒有任何意義。這對 (-580, 10000) 是什麼意思?沒有什麼!

換句話說,你不能在輸入上建立截止值——你必須在輸出上做,這就是模型的重點。

引用自:https://stats.stackexchange.com/questions/67560

comments powered by Disqus