Independence
統計獨立性是否意味著缺乏因果關係?
兩個隨機變量 A 和 B 在統計上是獨立的。這意味著在流程的 DAG 中:而且當然. 但這是否也意味著從 B 到 A 沒有前門?
因為那時我們應該得到. 那麼,如果是這樣的話,統計獨立性是否自動意味著缺乏因果關係?
那麼,如果是這樣的話,統計獨立性是否自動意味著缺乏因果關係?
不,這裡有一個多元法線的簡單反例,
set.seed(100) n <- 1e6 a <- 0.2 b <- 0.1 c <- 0.5 z <- rnorm(n) x <- a*z + sqrt(1-a^2)*rnorm(n) y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n) cor(x, y)
有了相應的圖表,
在這裡,我們有和是邊緣獨立的(在多元正常情況下,零相關意味著獨立)。發生這種情況是因為後門路徑通過完全抵消了直接路徑到, 那是,. 因此. 然而,直接導致,我們有, 這不同於.
關聯、干預和反事實
我認為在這裡對關聯、干預和反事實進行一些澄清是很重要的。
因果模型需要關於系統行為的陳述:(i)在被動觀察下,(ii)在干預下,以及(iii)反事實。一個層面的獨立性並不一定會轉化為另一個層面。
如上例所示,我們之間可以沒有關聯和, 那是,, 仍然是這樣的操作改變分佈, 那是,.
現在,我們可以更進一步。我們可以有因果模型來干預不會改變人口分佈,但這並不意味著缺乏反事實因果關係!也就是說,即使, 對於每個人他們的結果如果你改變了他的. 這正是 user20160 所描述的情況,以及我之前的回答。
根據回答每個問題所需的信息,這三個級別構成了因果推理任務的層次結構。