Classification

連續結果的敏感性和特異性類似物

  • January 31, 2013

如何計算連續診斷測試在預測連續結果(例如,血壓)時的敏感性和特異性(或類似測量)而不將結果二分法?有任何想法嗎?

似乎研究人員已經使用混合效應建模(見下面的鏈接)完成了這項工作,但我不熟悉他們對該技術的使用: http ://www.ncbi.nlm.nih.gov/pmc/articles/PMC3026390/

順便說一句,我對 R 最為熟悉,因此對於您建議的帶有 R 函數的實現來說,這將是理想的(但如果沒有也可以)。

提前感謝您的任何建議!

由於問題仍未得到解答,這是我的 2ct:

我認為這裡有兩個不同的主題混合到這個問題中:

如何計算連續診斷測試在預測連續結果(例如,血壓)時的敏感性和特異性(或類似測量)而不將結果二分法?

我認為您想衡量模型的性能。該模型預測來自某種輸入的連續(度量)結果(在您的示例中也可能是度量,但這在這裡並不重要)。這是一個回歸場景,而不是分類。所以你最好尋找回歸模型的性能指標,敏感性和特異性不是你要找的*。

一些回歸問題具有“自然”分組為某物的存在和不存在,這提供了與分類的鏈接。為此,您可能有一個雙峰分佈:大量不存在的案例,以及存在案例的值的度量分佈。例如,想一想污染某些產品的物質。許多產品樣品不會含有污染物,但對於那些含有污染物的樣品,會觀察到一定範圍的濃度。

但是,對於您的血壓示例,情況並非如此(此處沒有血壓不是一個明智的概念)。我什至猜想血壓呈單峰分佈。所有這些都指向一個與分類沒有密切聯繫的回歸問題。

*需要注意的是,這兩個詞都在分析化學中用於回歸(校準),但含義不同:在那裡,靈敏度是校準/回歸函數的斜率,而特定有時意味著該方法是完全選擇性的,即是否對分析物以外的其他物質不敏感,不發生交叉敏感性。

AD McNaught 和 A. Wilkinson 編輯:化學術語綱要(“金書”)。布萊克威爾科學,1997。國際標準書號:0-9678550-9-8。DOI:doi:10.1351/金本。網址:http://goldbook.iupac.org/

連續結果的敏感性和特異性類似物

另一方面,如果問題的本質是分類,您可能仍然會發現自己通過回歸更好地描述它:

  • 回歸描述了屬於類的程度(如在模糊集中)。
  • 屬於類的回歸模型(後驗)概率(如邏輯回歸
  • 您的案例可以描述為純類的混合(非常接近“正常”回歸,上面的污染示例)

對於這些情況,將敏感性和特異性背後的概念擴展到“連續結果分類器”是有意義的。基本思想是根據每個案例屬於相關類別的程度對其進行加權。對於參考標籤的敏感性和特異性,對於預測的類成員的預測值。事實證明,這導致與回歸類型的性能測量非常密切的聯繫。

我們最近在 [C. Beleites、R. Salzer 和 V. Sergo 中對此進行了描述:使用部分類成員身份驗證軟分類模型:適用於星形細胞瘤組織 Chemom

分級的敏感性和 Co. 的擴展概念。
英特爾。實驗室。Syst., 122 (2013), 12 - 22.](http://softclassval.r-forge.r-project.org/2013/2013-01-03-ChemomIntellLabSystTheorypaper.html)

該鏈接指向 R 包的主頁,用於實施建議的性能測量。

同樣,恕我直言,血壓示例沒有被充分描述為分類問題。但是,您可能仍想閱讀這篇論文——我認為參考值的製定將清楚地表明,血壓並沒有以適合分類的方式進行合理的描述。

(如果您制定一個連續程度的“高血壓”,這本身就是一個模型,並且與您描述的問題不同。)


我只是快速瀏覽了您鏈接的論文,但如果我理解正確,作者對兩種建模策略都使用閾值(二分法):對於連續預測進行進一步處理:計算預測間隔並與某個閾值進行比較。最後,他們有一個二分法的預測,並通過改變區間的規範來生成 ROC。

當您指定要避免這種情況時,該論文似乎並不過分相關。

引用自:https://stats.stackexchange.com/questions/49010

comments powered by Disqus