在有向無環圖中表示交互作用
有向無環圖(DAG;例如,Greenland 等人,1999)是因果關係陣營的反事實解釋的因果推理形式主義的一部分。在這些圖中,變量箭頭的存在 $ A $ 可變 $ B $ 斷言該變量 $ A $ 直接導致(風險的一些變化)變量 $ B $ ,並且沒有這樣的箭頭斷言該變量 $ A $ 不直接導致(風險的一些變化)變量 $ B $ .
例如,在下面的非 DAG因果圖中,“煙草煙霧暴露直接導致間皮瘤風險的變化”這一陳述由從“煙草煙霧暴露”到“間皮瘤”的黑色箭頭表示。
同樣,在下面的非 DAG因果圖中,“石棉暴露直接導致間皮瘤風險的變化”這一陳述由從“石棉暴露”到“間皮瘤”的黑色箭頭表示。
我使用術語不是 DAG來描述下面的因果圖,因為紅色箭頭,我打算斷言類似“石棉暴露導致煙草煙霧暴露對間皮瘤風險的直接因果影響發生變化”(石棉對物理對肺細胞的損害,除了直接導致間皮瘤風險的變化外,還使細胞更容易受到煙草煙霧暴露的致癌危害,結果暴露於石棉和煙草導致增加風險大於兩個單獨風險的總和),這與我在問題開始時描述的 DAG 中因果箭頭的正式含義不太相符(即,因為紅色箭頭不會終止於變量)。
如何在 DAG 的視覺形式中正確地表示交互效果?
參考
Greenland, S.、Pearl, J. 和 Robins, JM (1999)。流行病學研究的因果圖。流行病學,10(1):37-48。
珀爾的因果關係理論完全是非參數的。因此,無論在圖表中還是在它所代表的結構方程中,都沒有明確說明相互作用。然而,因果效應可能因假設而異(大不相同)。
如果確定了一個影響,並且您從非參數數據中對其進行估計,您將獲得因果影響的完整分佈(而不是單個參數)。因此,您可以以非參數的方式評估煙草暴露條件對石棉暴露的因果影響,以查看它是否會發生變化,而無需採用任何函數形式。
讓我們看一下您案例中的結構方程式,它對應於您的“DAG”,去掉了紅色箭頭:
間皮瘤 =(煙草、石棉、)
煙草=()
石棉 =()
在哪裡由於它們之間缺少虛線箭頭,因此假定它們是獨立的。
我們沒有指定各自的函數 f() 和錯誤的分佈,只是說後者是獨立的。儘管如此,我們可以應用珀爾的理論並立即聲明煙草和石棉暴露對間皮瘤的因果影響已經確定。這意味著,如果我們從這個過程中獲得無限多的觀察結果,我們可以通過簡單地查看具有不同暴露水平的個體間皮瘤的發病率來準確測量將暴露*設置為不同水平的效果。*所以我們可以在不做實際實驗的情況下推斷因果關係。這是因為從暴露變量到結果變量不存在後門路徑。
所以你會得到
P(間皮瘤 | do(煙草 = t)) = P(間皮瘤 | 煙草 = t)
同樣的邏輯也適用於石棉的因果效應,這使您可以簡單地評估:
P(間皮瘤 | 煙草 = t, 石棉 = a) - P(間皮瘤 | 煙草 = t', 石棉 = a)
相比
P(間皮瘤 | 煙草 = t, 石棉 = a') - P(間皮瘤 | 煙草 = t', 石棉 = a')
對於 t 和 a 的所有相關值,以估計交互作用。
在您的具體示例中,假設結果變量是伯努利變量-您可能患有間皮瘤,也可能沒有間皮瘤-並且一個人已接觸到非常高的石棉水平 a。那麼,他很可能會患上間皮瘤;因此,增加煙草接觸的影響將非常低。另一方面,如果石棉水平 a' 非常低,則增加煙草接觸會產生更大的影響。這將構成煙草和石棉的影響之間的相互作用。
當然,對於有限數據和大量不同的 t 和 a 值,非參數估計可能非常苛刻和嘈雜,因此您可能會考慮在 f() 中假設一些結構。但基本上你可以做到這一點。