Correlation
偏相關的含義
來自維基百科
形式上,之間的偏相關 X 和 Y 給定一組 n 控制變量 Z=Z1,Z2,…,Zn , 寫 ρXY·Z , 是殘差之間的相關性 RX 和 RY 由線性回歸產生 X 和 Z 和 Y 和 Z , 分別。
- 前面說
偏相關測量兩個隨機變量之間的關聯程度,去除了一組控制隨機變量的影響。
我想知道偏相關如何 ρXY·Z 與之間的相關性有關 X 和 Y 有條件的 Z ? 2. 有一個特殊情況 n=1 .
實際上,一階偏相關(即當 n=1 ) 只不過是相關性與可移除相關性的乘積除以可移除相關性的異化係數的乘積之間的差異。Guilford (1973, pp. 344–345) 提供了異化係數及其通過相關性與聯合方差的關係。
我想知道如何在數學上寫下上面的內容?
請注意,相關性的條件是 Z 是一個變量,取決於 Z ,而偏相關是一個數字。
此外,偏相關是基於線性回歸的殘差定義的。因此,如果實際關係是非線性的,則偏相關可能會獲得與條件相關不同的值,即使相關條件基於 Z 是一個獨立於的常數 Z . 另一方面,它 X,Y,X 是多元高斯,偏相關等於條件相關。
對於恆定條件相關性的示例 ≠ 偏相關:Z∼U(−1,1), X=Z2+e, Y=Z2−e, e∼N(0,1),e⊥Z.
不管是哪個值 Z 需要時,條件相關將為-1。然而,線性回歸 X|Z , Y|Z 將是常數 0,因此殘差將是值 X , Y 他們自己。因此,偏相關等於 X , Y ; 不等於-1,很明顯變量不完全相關,如果 Z 不知道。顯然,Baba 和 Sibuya (2005)顯示了除多元高斯分佈之外的一些其他分佈的偏相關和條件相關的等價性,但我沒有讀過這個。
您的問題 2 的答案似乎存在於 Wikipedia 文章中,即Using recursive formula下的第二個方程。