Correlation
相關性的物理意義?
假設 X 描述了一個隨機變量,表示某人今天掃地所用的時間,Y 是他明天所用的時間,Z 是他在 10 月最後一天所用的時間。
- 如果假設 X、Y 和 Z 是獨立的,則意味著該人沒有“學習”如何通過第一天的經驗更快地掃過,並且 X 的結果與 Y 和 Z 的結果無關。
- 當 X、Y 和 Z 具有一定量的相關係數(例如 0.5)時,這在物理上意味著什麼。
我明白那個
假設 X、Y 和 Z 各有 100 個值,用於 100 個不同的掃地機。
- 如果 X、Y 和 Z 是獨立的,則意味著一個人在較晚日期掃地的速度不取決於他/她在較早日期的掃地速度。但是,即使獨立,該比率也有可能係統地增加。如果後面大家掃得更快,如果增加不依賴於初始速度,就會出現這種情況。
- 我見過的可視化不同幅度相關性的最佳方法是繪製它們。
x <- rnorm(100) y <- x + rnorm(100, 0, .5) cor(x,y) plot(x,y) y <- x + rnorm(100, 0, 1) cor(x,y) plot(x,y) y <- x + rnorm(100, 0, 2) cor(x,y) plot(x,y)
顯示了大約 0.9、0.7 和 0.5 的相關性。