Epidemiology

陽性和陰性預測值的統計檢驗

  • January 17, 2011

我正在閱讀一篇論文,看到一張表格,其中比較了 PPV(正預測值)和 NPV(負預測值)之間的比較。他們為他們做了某種統計測試,這是表格的草圖:

PPV    NPV    p-value
65.9   100    < 0.00001
...

每行都指一個特定的列聯表。

他們做了什麼樣的假設檢驗?謝謝!

假設如下所示的交叉分類(此處為篩選工具)

替代文字

我們可以定義篩選準確性和預測能力的四種衡量標準:

  • 敏感性(se), a/(a + c),即在存在疾病的情況下篩查提供陽性結果的概率;
  • 特異性(sp), d/(b + d),即在不存在疾病的情況下篩查提供陰性結果的概率;
  • 陽性預測值(PPV),a/(a+b),即檢測結果為陽性的患者被正確診斷(為陽性)的概率;
  • 陰性預測值(NPV),d/(c+d),即檢測結果為陰性的患者被正確診斷(為陰性)的概率。

每四個度量都是根據觀察數據計算的簡單比例。因此,合適的統計測試將是二項式(精確)測試,它應該在大多數統計軟件包或許多在線計算器中都可用。檢驗假設是觀察到的比例是否顯著不同於 0.5。然而,我發現提供置信區間比提供單一顯著性檢驗更有趣,因為它提供了有關測量精度的信息。無論如何,為了重現您顯示的結果,您需要知道雙向表的總邊距(您只給出了 PPV 和 NPV 作為百分比)。

例如,假設我們觀察到以下數據(CAGE 問卷是酒精篩查問卷):

替代文字

然後在 R 中,PPV 將按如下方式計算:

> binom.test(99, 142)

   Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
0.6145213 0.7714116 
sample estimates:
probability of success 
            0.6971831 

如果您使用的是 SAS,那麼您可以查看使用說明 24170:如何估計敏感性、特異性、陽性和陰性預測值、假陽性和陰性概率以及似然比?.

為了計算置信區間,高斯近似,(1.96 是標準正態分佈的分位數或者和%),在實踐中使用,特別是當比例非常小或非常大時(這裡經常出現這種情況)。

如需進一步參考,您可以查看

紐科姆,RG。單一比例的雙邊置信區間:七種方法的比較醫學統計,17, 857-872 (1998)。

引用自:https://stats.stackexchange.com/questions/6309

comments powered by Disqus