Causality

為什麼傾向得分匹配比匹配更好?

  • February 11, 2021

高級傾向得分匹配使用以下框架:

  1. 從協變量中識別潛在的混雜因素,即所有可能影響受試者成為實驗組一部分的因素
  2. 計算傾向得分 = Pr(受試者是治療的一部分 | 協變量)
  3. 創建一個模型來估計每個接受治療的受試者的成員資格。
  4. 受試者根據傾向得分分為多個控制/實驗層。這將使組與在協變量方面具有相似特徵的受試者保持平衡。
  5. 通過平均每個層的因變量的差異總和來計算治療效果。

我的問題是:為什麼這比僅將治療對象與通過距離測量和協變量值測量的類似未治療對象匹配更好?然後平均所有治療-未治療受試者對之間的差異總和?

這似乎更簡單,並且似乎可以解決 PSM 旨在減少/消除的自我選擇偏差。

我在這裡想念什麼?

您描述的過程不是傾向得分匹配,而是傾向得分子分類。在傾向得分匹配中,根據傾向得分之間的差異選擇成對的單元,並丟棄未配對的單元。這兩種方法都是使用傾向評分來減少在觀察性研究中導致混淆偏差的不平衡的流行方法。

在傾向得分匹配中,兩個單位之間的距離是它們傾向得分之間的差,傾向得分是根據協變量計算的,因此通過傾向得分匹配,您是基於距離度量和協變量值進行匹配。還有其他不涉及匹配中經常使用的傾向得分的距離度量,例如馬氏距離。一些研究表明,作為距離度量,馬氏距離比傾向得分差更有效,而一些研究表明並非如此。每個的相對性能取決於數據集的獨特特徵;對於哪種方法更好,沒有辦法提供一個始終正確的單一規則。兩者都應該嘗試。您還可以將傾向得分作為協變量包含在馬氏距離中。

如果您的問題更多是關於為什麼我們會在可以進行傾向得分匹配時進行傾向得分子分類,那麼有一些考慮因素。和以前一樣,您應該始終使用在您的樣品中產生最佳平衡的任何方法。傾向得分子分類可以更好地實現某些數據集的平衡和其他數據集的傾向得分匹配。沒有理由單方面決定使用一種方法而不是另一種方法。子分類允許您估計 ATT 或 ATE,而大多數匹配方法只允許 ATT。當以某些方式使用時,子分類與傾向得分加權密切相關,而匹配通常不會為個體分配不均勻的權重。通過匹配,您可以更多地自定義規格(例如,通過使用卡尺,通過改變控制與處理的比率等),而通過子分類,定制的機會更加有限。面對完全匹配,匹配和子分類之間的區別是模糊的,完全匹配是兩者之間的混合體,通常表現得更好。一些論文比較了這兩種方法的性能,但正如我之前提到的,重要的是不要依賴一般結果,而是在樣本中嘗試這兩種方法。

查看 R 包的文檔MatchIt其中詳細介紹了幾種匹配方法,並討論了它們的一些相對優點和自定義方法。

引用自:https://stats.stackexchange.com/questions/509094

comments powered by Disqus