Correlation

相關性在每組中顯著但總體上不顯著?

  • June 17, 2012

假設我們測試變量之間的 Pearson 相關性和在群組裡和. 是否有可能相關性在每個方面都顯著和,但是當兩個組的數據合併時不顯著?在這種情況下,您能否提供一個解釋。

是的,這是可能的,並且可能以各種方式發生。一個明顯的例子是,當以某種反映 x 和 y 值的方式選擇 A 和 B 的成員時。其他示例也是可能的,例如@Macro 的評論提出了另一種可能性。

考慮下面的例子,用 R 編寫。x 和 y 是獨立同分佈的標準正態變量,但是如果我根據 x 和 y 的相對值將它們分配到組,我會得到你命名的情況。在 A 組和 B 組內,x 和 y 之間存在很強的統計顯著相關性,但如果忽略分組結構,則沒有相關性。

在此處輸入圖像描述

> library(ggplot2)
> x <- rnorm(1000)
> y <- rnorm(1000)
> Group <- ifelse(x>y, "A", "B")
> cor.test(x,y)

       Pearson's product-moment correlation

data:  x and y 
t = -0.9832, df = 998, p-value = 0.3257
alternative hypothesis: true correlation is not equal to 0 
95 percent confidence interval:
-0.09292  0.03094 
sample estimates:
    cor 
-0.03111 

> cor.test(x[Group=="A"], y[Group=="A"])

       Pearson's product-moment correlation

data:  x[Group == "A"] and y[Group == "A"] 
t = 11.93, df = 487, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0 
95 percent confidence interval:
0.4040 0.5414 
sample estimates:
  cor 
0.4756 

> cor.test(x[Group=="B"], y[Group=="B"])

       Pearson's product-moment correlation

data:  x[Group == "B"] and y[Group == "B"] 
t = 9.974, df = 509, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0 
95 percent confidence interval:
0.3292 0.4744 
sample estimates:
  cor 
0.4043 
> qplot(x,y, color=Group)

引用自:https://stats.stackexchange.com/questions/30607

comments powered by Disqus

相關問答