使用邏輯回歸係數的優勢比計算風險比
我有一個二元邏輯回歸,只有一個二元固定因子預測器。我不將其作為卡方或費舍爾精確檢驗的原因是我還有許多隨機因素(每個人有多個數據點,並且個人是分組的,儘管我不關心係數或顯著性對於那些隨機變量)。我用 R glmer 做這個。
我希望能夠將預測變量的係數和相關置信區間表示為風險比而不是優勢比。這是因為(可能不是為你,而是為我的聽眾)風險比更容易理解。此處的風險比是如果預測變量為 1 而不是 0,則結果為 1 而不是 0 的機會的相對增加。
使用 exp() 從係數和相關 CI 中獲取優勢比是微不足道的。要將優勢比轉換為風險比,您可以使用“RR = OR / (1 – p + (px OR)),其中 p 是對照組的風險”(來源:http://www.r- bloggers.com/how-to-convert-odds-ratio-to-relative-risks/)。但是,您需要控制組中的風險,在我的情況下,這意味著如果預測變量為 0,則結果為 1 的機會。我相信模型中的截距係數實際上是這種機會的可能性,所以我可以使用prob=odds/(odds+1) 得到那個。就風險比率的中心估計而言,我對此非常滿意。但讓我擔心的是關聯的置信區間,因為截距係數也有自己關聯的 CI。我應該使用截距的中心估計值,還是保守起見,我應該使用截距 CI 的任何限制,使我的相對風險 CI 最寬?還是我完全找錯了樹?
Zhang 1998 最初提出了一種計算風險比 CI 的方法,建議您可以使用 CI 的下限和上限作為優勢比。
這種方法不起作用,它是有偏見的,並且通常會產生對風險比 95% CI 的反保守(過緊)估計。這是因為您正確提到的截距項和斜率項之間的相關性。如果優勢比趨向於 CI 中的較低值,則截距項會增加,以說明暴露水平為 0 的人群的總體患病率較高,反之則說明 CI 中的值較高。這些中的每一個分別導致 CI 的下限和上限。
要直接回答您的問題,您需要了解結果的基線流行度以獲得正確的置信區間。來自病例對照研究的數據將依賴其他數據來告知這一點。
或者,如果您具有參數估計的完整協方差結構,則可以使用 delta 方法。OR 到 RR 轉換(具有二進制曝光和單個預測器)的等效參數化是:
並使用多元 delta 方法和中心極限定理, 可以得到近似正態分佈的方差.
請注意,這僅適用於二元曝光和單變量邏輯回歸。有一些簡單的 R 技巧可以利用 delta 方法和邊際標準化來處理連續協變量和其他調整變量。但為簡潔起見,我不會在這裡討論。
但是,有幾種方法可以直接從 R 中的模型計算相對風險及其標準誤差。以下兩個示例:
x <- sample(0:1, 100, replace=T) y <- rbinom(100, 1, x*.2+.2) glm(y ~ x, family=binomial(link=log)) library(survival) coxph(Surv(time=rep(1,100), event=y) ~ x)
http://research.labiomed.org/Biostat/Education/Case%20Studies%202005/Session4/ZhangYu.pdf