連續結果的敏感性和特異性類似物

January 31, 2013

如何計算連續診斷測試在預測連續結果（例如，血壓）時的敏感性和特異性（或類似測量）而不將結果二分法？有任何想法嗎？

似乎研究人員已經使用混合效應建模（見下面的鏈接）完成了這項工作，但我不熟悉他們對該技術的使用： http ://www.ncbi.nlm.nih.gov/pmc/articles/PMC3026390/

順便說一句，我對 R 最為熟悉，因此對於您建議的帶有 R 函數的實現來說，這將是理想的（但如果沒有也可以）。

提前感謝您的任何建議！

由於問題仍未得到解答，這是我的 2ct：

我認為這裡有兩個不同的主題混合到這個問題中：

如何計算連續診斷測試在預測連續結果（例如，血壓）時的敏感性和特異性（或類似測量）而不將結果二分法？

我認為您想衡量模型的性能。該模型預測來自某種輸入的連續（度量）結果（在您的示例中也可能是度量，但這在這裡並不重要）。這是一個回歸場景，而不是分類。所以你最好尋找回歸模型的性能指標，敏感性和特異性不是你要找的*。

一些回歸問題具有“自然”分組為某物的存在和不存在，這提供了與分類的鏈接。為此，您可能有一個雙峰分佈：大量不存在的案例，以及存在案例的值的度量分佈。例如，想一想污染某些產品的物質。許多產品樣品不會含有污染物，但對於那些含有污染物的樣品，會觀察到一定範圍的濃度。

但是，對於您的血壓示例，情況並非如此（此處沒有血壓不是一個明智的概念）。我什至猜想血壓呈單峰分佈。所有這些都指向一個與分類沒有密切聯繫的回歸問題。

*需要注意的是，這兩個詞都在分析化學中用於回歸（校準），但含義不同：在那裡，靈敏度是校準/回歸函數的斜率，而特定有時意味著該方法是完全選擇性的，即是否對分析物以外的其他物質不敏感，不發生交叉敏感性。

AD McNaught 和 A. Wilkinson 編輯：化學術語綱要（“金書”）。布萊克威爾科學，1997。國際標準書號：0-9678550-9-8。DOI：doi：10.1351/金本。網址：http://goldbook.iupac.org/。

連續結果的敏感性和特異性類似物

另一方面，如果問題的本質是分類，您可能仍然會發現自己通過回歸更好地描述它：

回歸描述了屬於類的程度（如在模糊集中）。

屬於類的回歸模型（後驗）概率（如邏輯回歸）

您的案例可以描述為純類的混合（非常接近“正常”回歸，上面的污染示例）

對於這些情況，將敏感性和特異性背後的概念擴展到“連續結果分類器”是有意義的。基本思想是根據每個案例屬於相關類別的程度對其進行加權。對於參考標籤的敏感性和特異性，對於預測的類成員的預測值。事實證明，這導致與回歸類型的性能測量非常密切的聯繫。

我們最近在 [C. Beleites、R. Salzer 和 V. Sergo 中對此進行了描述：使用部分類成員身份驗證軟分類模型：適用於星形細胞瘤組織 Chemom

分級的敏感性和 Co. 的擴展概念。
英特爾。實驗室。Syst., 122 (2013), 12 - 22.](http://softclassval.r-forge.r-project.org/2013/2013-01-03-ChemomIntellLabSystTheorypaper.html)

該鏈接指向 R 包的主頁，用於實施建議的性能測量。

同樣，恕我直言，血壓示例沒有被充分描述為分類問題。但是，您可能仍想閱讀這篇論文——我認為參考值的製定將清楚地表明，血壓並沒有以適合分類的方式進行合理的描述。

（如果您制定一個連續程度的“高血壓”，這本身就是一個模型，並且與您描述的問題不同。）

我只是快速瀏覽了您鏈接的論文，但如果我理解正確，作者對兩種建模策略都使用閾值（二分法）：對於連續預測進行進一步處理：計算預測間隔並與某個閾值進行比較。最後，他們有一個二分法的預測，並通過改變區間的規範來生成 ROC。

當您指定要避免這種情況時，該論文似乎並不過分相關。

引用自：https://stats.stackexchange.com/questions/49010

comments powered by Disqus

連續結果的敏感性和特異性類似物

相關問答

沒有統計知識的人的 AUC

為什麼 ROC 對類分佈不敏感？

離散變量和連續變量。定義是什麼？

我可以（合理地）僅根據先前模型預測不佳的觀察結果訓練第二個模型嗎？

為什麼這個線性混合模型是奇異的？

為什麼兩個絕對連續的隨機變量之和不一定是絕對連續的？