多重插補後的傾向得分匹配
我參考這篇論文:Hayes JR,Groner JI。 “使用多重插補和傾向得分來測試汽車座椅和安全帶使用對創傷登記數據的傷害嚴重程度的影響。” 小兒外科雜誌。2008 年 5 月;43(5):924-7。
在本研究中,進行了多重插補以獲得 15 個完整的數據集。然後為每個數據集計算傾向得分。然後,對於每個觀察單元,從已完成的 15 個數據集中(包括相關的傾向得分)中隨機選擇一個記錄,從而創建一個最終數據集,然後通過傾向得分匹配對其進行分析。
我的問題是:這是在多重插補後執行傾向得分匹配的有效方法嗎?有其他方法嗎?
背景:在我的新項目中,我的目標是使用傾向得分匹配比較兩種治療方法的效果。有缺失數據,我打算使用
MICE
R中的包來估算缺失值,然後twang
進行傾向得分匹配,然後lme4
分析匹配的數據。更新1:
我發現這篇論文采用了不同的方法:Mitra, Robin and Reiter, Jerome P. (2011) Propensity score matching with missing covariates via itered,sequential multiple imputation [工作論文]
在本文中,作者計算所有插補數據集的傾向得分,然後通過平均將它們匯集起來,這是使用魯賓規則進行點估計的多重插補的精神 - 但它真的適用於傾向得分嗎?
如果 CV 上的任何人都可以提供對這兩種不同方法和/或任何其他方法的評論的答案,那將是非常好的……
首先要說的是,對我來說,方法 1(抽樣)似乎沒有太多優點——它放棄了多重插補的好處,並減少了對每個觀察的單一插補,正如 Stas 所提到的。我看不出使用它有什麼好處。
在 Hill (2004) 中,圍繞缺失數據的傾向評分分析問題進行了精彩的討論:Hill, J. “Reducing Bias in Treatment Effect Estimation in Observational Studies Suffing from Missing Data” ISERP Working Papers, 2004。可從以下網址下載在這裡。
本文考慮了使用多重插補(以及其他處理缺失數據的方法)和傾向得分的兩種方法:
- 多重插補後傾向得分的平均值,然後是因果推理(上面帖子中的方法2)
- 使用來自多重插補的每組傾向得分進行因果推斷,然後對因果估計進行平均。
此外,本文還考慮了結果是否應作為預測變量包含在插補模型中。
Hill 斷言,雖然多重插補優於其他處理缺失數據的方法,但一般來說,沒有先驗有理由更喜歡其中一種技術而不是另一種。但是,可能有理由更喜歡對傾向得分進行平均,特別是在使用某些匹配算法時。Hill 在同一篇論文中進行了一項模擬研究,發現在因果推斷之前對傾向得分進行平均,當在插補模型中包含結果時,在均方誤差方面產生了最好的結果,並且首先對得分進行平均,但沒有結果在插補模型中,在平均偏差(估計和真實治療效果之間的絕對差異)方面產生了最好的結果。通常,建議將結果包含在插補模型中(例如,請參見此處)。
所以看起來你的方法2是要走的路。