K-Nearest-Neighbour

R中傾向得分匹配後的不同結果

February 9, 2017

我已經進行了 Prospensity Score Matching（在 R 中使用 R 包“Matchit”）。我使用了匹配方法“最近鄰”。匹配後，我比較了治療組和對照組的結果變量。對於這個比較，我使用了 t 檢驗。我發現在每個匹配過程之後，t 檢驗的結果都發生了變化。為了測試我的假設，即結果的這種變化是由於傾向得分的隨機選擇（用於最近鄰匹配），我將隨機數生成器設置為特定的種子，並多次執行匹配過程。通過設置 RNG，結果不再不同。

每次匹配程序後都面臨不同的結果：我如何決定使用哪種匹配解決方案進行進一步分析？多次進行匹配程序（比如 10'000）並報告我從幾個 t 檢驗中獲得的結果的 p 值和 t 值的中值是否是一種有效的方法？

當您（至少）有兩個人具有相同的傾向得分時，就會發生這種情況。MatchIt 隨機選擇一個包含在匹配集中。我的建議是選擇一個匹配的集合併用它進行分析。我同意嘗試其他調節方法，例如完全匹配和 IPW 將是一個好主意。您可以在敏感性分析部分報告各種分析的結果。

編輯：這可能是錯誤的答案。請參閱 Viktor 的回答，了解可能的實際原因。

編輯 2020-12-07：對於MatchIt低於 4.0.0 的版本，最近鄰匹配時會發生的唯一隨機選擇是存在關係時或時m.order = "random"，這不是默認值。如果在匹配中使用的變量很少，特別是如果它們都是分類變量或取很少的值，則可能出現平局。從 4.0.0 版開始，不再有任何隨機進程，除非m.order = "random"; 根據數據的順序確定性地打破所有關係。

引用自：https://stats.stackexchange.com/questions/260918

comments powered by Disqus

相關問答

Multiple-Regression

為什麼我們要匹配因果推理與回歸混雜因素？

September 16, 2021

傾向得分匹配的用例是什麼？

April 30, 2021

為什麼傾向得分匹配比匹配更好？

February 11, 2021

傾向得分匹配 - 有什麼問題？

August 1, 2020

我應該使用機器學習模型來計算傾向得分嗎？

August 7, 2019

R

傾向評分加權平均治療效果的置信區間？

January 7, 2015