Correlation
相關性在每組中顯著但總體上不顯著?
假設我們測試變量之間的 Pearson 相關性和在群組裡和. 是否有可能相關性在每個方面都顯著和,但是當兩個組的數據合併時不顯著?在這種情況下,您能否提供一個解釋。
是的,這是可能的,並且可能以各種方式發生。一個明顯的例子是,當以某種反映 x 和 y 值的方式選擇 A 和 B 的成員時。其他示例也是可能的,例如@Macro 的評論提出了另一種可能性。
考慮下面的例子,用 R 編寫。x 和 y 是獨立同分佈的標準正態變量,但是如果我根據 x 和 y 的相對值將它們分配到組,我會得到你命名的情況。在 A 組和 B 組內,x 和 y 之間存在很強的統計顯著相關性,但如果忽略分組結構,則沒有相關性。
> library(ggplot2) > x <- rnorm(1000) > y <- rnorm(1000) > Group <- ifelse(x>y, "A", "B") > cor.test(x,y) Pearson's product-moment correlation data: x and y t = -0.9832, df = 998, p-value = 0.3257 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: -0.09292 0.03094 sample estimates: cor -0.03111 > cor.test(x[Group=="A"], y[Group=="A"]) Pearson's product-moment correlation data: x[Group == "A"] and y[Group == "A"] t = 11.93, df = 487, p-value < 2.2e-16 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.4040 0.5414 sample estimates: cor 0.4756 > cor.test(x[Group=="B"], y[Group=="B"]) Pearson's product-moment correlation data: x[Group == "B"] and y[Group == "B"] t = 9.974, df = 509, p-value < 2.2e-16 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.3292 0.4744 sample estimates: cor 0.4043 > qplot(x,y, color=Group)