K-Nearest-Neighbour
R中傾向得分匹配後的不同結果
我已經進行了 Prospensity Score Matching(在 R 中使用 R 包“Matchit”)。我使用了匹配方法“最近鄰”。匹配後,我比較了治療組和對照組的結果變量。對於這個比較,我使用了 t 檢驗。我發現在每個匹配過程之後,t 檢驗的結果都發生了變化。為了測試我的假設,即結果的這種變化是由於傾向得分的隨機選擇(用於最近鄰匹配),我將隨機數生成器設置為特定的種子,並多次執行匹配過程。通過設置 RNG,結果不再不同。
- 每次匹配程序後都面臨不同的結果:我如何決定使用哪種匹配解決方案進行進一步分析?多次進行匹配程序(比如 10'000)並報告我從幾個 t 檢驗中獲得的結果的 p 值和 t 值的中值是否是一種有效的方法?
當您(至少)有兩個人具有相同的傾向得分時,就會發生這種情況。MatchIt 隨機選擇一個包含在匹配集中。我的建議是選擇一個匹配的集合併用它進行分析。我同意嘗試其他調節方法,例如完全匹配和 IPW 將是一個好主意。您可以在敏感性分析部分報告各種分析的結果。
編輯:這可能是錯誤的答案。請參閱 Viktor 的回答,了解可能的實際原因。
編輯 2020-12-07:對於
MatchIt
低於 4.0.0 的版本,最近鄰匹配時會發生的唯一隨機選擇是存在關係時或 時m.order = "random"
,這不是默認值。如果在匹配中使用的變量很少,特別是如果它們都是分類變量或取很少的值,則可能出現平局。從 4.0.0 版開始,不再有任何隨機進程,除非m.order = "random"
; 根據數據的順序確定性地打破所有關係。