Correlation

計算兩個布爾向量之間的 Pearson 或 Spearman 相關是否有意義?

  • June 18, 2014

有兩個布爾向量,它們只包含 0 和 1。如果我計算 Pearson 或 Spearman 相關性,它們是否有意義或合理?

只要你有一些,就定義了 Pearson 和 Spearman 相關性 $ 0 $ s和一些 $ 1 $ s 對於兩個二進制變量,比如說 $ y $ 和 $ x $ . 通過考慮兩個變量的散點圖,很容易對它們的含義有一個很好的定性概念。顯然,只有四種可能 $ (0,0), (0,1), (1, 0), (1,1) $ (因此抖動以將相同的點分開以進行可視化是一個好主意)。例如,在兩個向量相同的任何情況下,每個向量都有一些 0 和一些 1,然後根據定義 $ y = x $ 並且相關性是必然的 $ 1 $ . 同樣,有可能 $ y = 1 -x $ 然後相關性是 $ -1 $ .

對於這種設置,沒有非線性的單調關係的範圍。排位時 $ 0 $ 沙 $ 1 $ s 在通常的 midrank 約定下,排名只是原始的線性變換 $ 0 $ 沙 $ 1 $ s 和 Spearman 相關必然與 Pearson 相關相同。因此,這裡沒有理由單獨考慮 Spearman 相關性,或者根本就沒有理由。

對於一些涉及的問題,相關性自然會產生 $ 0 $ 沙 $ 1 $ s,例如研究時間或空間中的二元過程。然而,總體而言,將有更好的方式來思考這些數據,這在很大程度上取決於此類研究的主要動機。例如,相關性很有意義這一事實並不意味著線性回歸是對二元響應建模的好方法。如果其中一個二元變量是響應,那麼大多數統計人員會從考慮 logit 模型開始。

引用自:https://stats.stackexchange.com/questions/103801

comments powered by Disqus