Stata
傾向得分與面板數據匹配
我有個人的縱向數據集,其中一些人接受了治療,而另一些人則沒有。所有個體從出生到 18 歲都在樣本中,並且治療發生在該範圍之間的某個年齡。治療的年齡可能因病例而異。使用傾向得分匹配,我想將治療和控制單位成對匹配,並在出生年份進行精確匹配,這樣我就可以跟踪每一對從出生年份到 18 歲的情況。總而言之,大約有 150 名接受治療和 4000 名未經治療的人。匹配後的想法是使用差異中的差異策略來估計治療效果。
我目前面臨的問題是與面板數據進行匹配。我正在使用 Stata 的
psmatch2
命令,並使用傾向得分匹配來匹配家庭和個人特徵。一般來說,對於面板數據,每個年齡都會有不同的最佳匹配。例如:如果 A 被處理,B 和 C 是對照,並且他們都是 1980 年出生的,那麼 A 和 B 可能在 1980 年匹配到 0 歲,而 A 和 C 在 1981 年匹配到 1 歲,依此類推. A 也可以與其前幾年的預處理值相匹配。為了解決這個問題,我取了所有隨時間變化的變量的平均值,以便匹配可以識別在樣本期間平均最相似的個體,並且我對 0 到 18 歲的每個年齡組分別進行匹配。不幸的是,這仍然將不同的控制單元與每個年齡組的每個處理單元匹配。
如果有人可以指導我找到一種與 Stata 中的面板數據進行配對匹配的方法,我將不勝感激。
您基本上必須創建一個具有與匹配過程相關的所有特徵的寬格式數據集,在此橫截面數據集上執行匹配,然後使用 ID 來識別面板數據集中的匹配對。以下是更多細節:
- 用於
reshape
創建寬格式數據集。以您希望在匹配過程中使用它們的方式格式化預處理變量。如果您對一個人有多個觀察值,您可以只取變量的平均值,但您也可以提出其他方法(您還可以保留對相同變量的多個觀察值,例如 health1、health2 並在匹配中使用所有這些觀察值)。目標是擁有一個數據集,每個人都有一次觀察。- 使用此數據集,使用 執行匹配過程
psmatch2
。- 將匹配案例的信息與原始數據集合併。不匹配的丟棄案例等。我不確定這裡的細節,因為我真的不知道 stata,
psmatch2
但我想你明白了。使用這些步驟,您可以根據所有預處理信息匹配病例,並且每個治療單元只有一個匹配。