Simulation
為什麼不對部分模擬數據進行薈萃分析?
背景:
心理學中的典型元分析可能會試圖對兩個變量 X 和 Y 之間的相關性進行建模。分析通常涉及從文獻中獲取一組相關的相關性以及樣本量。然後可以應用公式來計算加權平均相關性。然後,可以進行分析以查看研究之間的相關性變化是否超過隨機抽樣的影響所暗示的差異。
此外,分析可以變得更加複雜。估計值可以根據可靠性、範圍限制等進行調整。相關性可以結合使用來探索元結構方程建模或元回歸等。
然而,所有這些分析都是使用匯總統計數據(例如,相關性、優勢比、標準化平均差)作為輸入數據進行的。這需要使用接受匯總統計的特殊公式和程序。
薈萃分析的替代方法
因此,我正在考慮使用原始數據作為輸入的元分析的替代方法。即,對於相關性,輸入數據將是用於形成相關性的原始數據。顯然,在大多數薈萃分析中,即使不是大部分,也有幾個實際原始數據不可用。因此,基本過程可能如下所示:
- 聯繫所有已發表的作者尋求原始數據,如果提供,請使用實際的原始數據。
- 對於不提供原始數據的作者,模擬原始數據,使其具有與報告的相同的匯總統計數據。這種模擬還可以結合從原始數據中獲得的任何知識(例如,如果已知變量是偏斜的,等等)。
在我看來,這種方法可能有幾個好處:
- 使用原始數據作為輸入的統計工具可用於分析
- 通過至少獲得一些實際的原始數據,薈萃分析的作者將被迫考慮與實際數據相關的問題(例如,異常值、分佈等)。
問題
- 對真實原始數據和模擬數據的組合進行薈萃分析研究是否存在與現有已發表研究具有相同匯總統計數據的任何問題?
- 這種方法會優於對匯總統計進行薈萃分析的現有方法嗎?
- 是否有任何現有文獻討論、倡導或批評這種方法?
已經存在旨在合成個人和聚合個人數據的方法。薩頓等人。(2008)論文應用了貝葉斯方法,(恕我直言)與您的想法有一些相似之處。
- Riley, RD, Lambert, PC, Staessen, JA, Wang, J., Gueyffier, F., Thijs, L., & Boutitie, F. (2007)。結合個體患者數據和匯總數據的連續結果的薈萃分析。醫學統計,27(11),1870-1893。doi:10.1002/sim.3165 PDF
- Riley, RD 和 Steyerberg, EW (2010)。使用個體參與者數據和匯總數據對二元結果進行元分析。研究綜合方法,1(1),2-19。doi:10.1002/jrsm.4
- Sutton, AJ, Kendrick, D. 和 Coupland, CAC (2008)。個人和總體數據的薈萃分析。醫學統計,27(5),651-669。