Correlation

之間的關係𝑅2R2R^2和相關係數

  • January 25, 2014

假設我有兩個一維數組, $ a_1 $ 和 $ a_2 $ . 每個包含 100 個數據點。 $ a_1 $ 是實際數據,並且 $ a_2 $ 是模型預測。在這種情況下, $ R^2 $ 價值將是: $$ R^2 = 1 - \frac{SS_{res}}{SS_{tot}} \quad\quad\quad\quad\quad\ \ \quad\quad(1). $$ 同時,這將等於相關係數的平方值, $$ R^2 = (\text{Correlation Coefficient})^2 \quad (2). $$ 現在,如果我交換兩者: $ a_2 $ 是實際數據,並且 $ a_1 $ 是模型預測。從方程 $ (2) $ ,因為相關係數不關心哪個先到, $ R^2 $ 值將是相同的。然而,從等式 $ (1) $ , $ SS_{tot}=\sum_i(y_i - \bar y )^2 $ , 這 $ R^2 $ 值會改變,因為 $ SS_{tot} $ 如果我們切換就改變了 $ y $ 從 $ a_1 $ 到 $ a_2 $ ; 同時, $ SS_{res}=\sum_i(y_i -f_i)^2 $ 不改變。

我的問題是:這些怎麼可能相互矛盾?

編輯

  1. 我想知道,方程式中的關係是否會。(2) 仍然成立,如果不是簡單的線性回歸,即IV和DV之間的關係不是線性的(可能是指數/對數)?
  2. 如果預測誤差的總和不等於 0,這種關係還會成立嗎?

這是真的會改變……但你忘記了平方的回歸總和也會改變的事實。因此,讓我們考慮簡單回歸模型並將相關係數表示為,我在哪裡使用了子索引強調一個事實是自變量並且是因變量。明顯地,如果你交換是不變的和. 我們可以很容易地證明, 在哪裡是平方和的回歸和 是平方的總和,其中是獨立的並且是因變量。所以:

在哪裡是對應的殘差平方和,其中是獨立的並且是因變量。請注意,在這種情況下,我們有和(請參見此處的方程式(34)-(41)。)因此:顯然上面的方程是關於對稱的和. 換句話說:總結當你改變和在簡單回歸模型中,分子和分母將以某種方式改變

引用自:https://stats.stackexchange.com/questions/83347

comments powered by Disqus