Spearman-Rho

Goodman-Kruskal gamma 和 Kendall tau 或 Spearman rho 相關性如何比較?

  • November 9, 2011

在我的工作中,我們將某些數據集的預測排名與真實排名進行比較。直到最近,我們一直在單獨使用 Kendall-Tau。一個從事類似項目的小組建議我們嘗試使用Goodman-Kruskal Gamma,他們更喜歡它。我想知道不同等級相關算法之間的區別是什麼。

我找到的最好的答案是這個答案,它聲稱使用 Spearman 代替通常的線性相關,並且 Kendall-Tau 不那麼直接,更類似於 Goodman-Kruskal Gamma。我正在使用的數據似乎沒有任何明顯的線性相關性,並且數據嚴重偏斜且不正常。

此外,對於我們的數據,Spearman 通常比 Kendall-Tau 報告更高的相關性,我想知道這對數據的具體說明是什麼。我不是統計學家,所以我正在閱讀的一些關於這些事情的論文對我來說似乎是行話,抱歉。

Spearman rho vs Kendall tau。這兩者在計算上是如此不同,以至於您無法直接比較它們的大小。Spearman 通常高出 1/4 到 1/3,這使得人們錯誤地得出結論,Spearman 對於特定數據集“更好”。rho 和 tau 之間的區別在於它們的意識形態、rho的方差比例和 tau 的**概率。Rho 是應用於排名數據的常用 Pearson r,並且與 r 一樣,對具有大矩的點(即與雲中心的偏差)比對具有小矩的點更敏感。因此rho對排序後的雲形狀相當敏感完成:長方形菱形雲的係數將高於長方形啞鈴雲的係數(因為第一個菱形雲的銳邊是大矩)。Tau 是 Gamma 的擴展,對所有數據點同樣敏感,因此對排序云形狀的特殊性不太敏感。Tau 比 rho 更“一般”,因為只有當您認為變量之間的潛在(模型或總體函數)關係是嚴格單調的時,rho 才被保證。雖然 Tau 允許非單調的基礎曲線和測量單調“趨勢”,無論是正面還是負面,總體上占主導地位。Rho 在大小上與 r 相當;tau 不是。

Kendall tau 飾演 Gamma。Tau 只是 Gamma 的一種標準化形式。幾個相關的措施都有分子但歸一化分母不同:

  • 伽瑪:
  • Somers 的 D(“x 依賴”):
  • Somers 的 D(“y 依賴”):
  • Somers' D(“symmetric”):以上兩者的算術平均值
  • 肯德爾的 Tau-b corr。(最適合方桌):這兩個的幾何平均值
  • 肯德爾的 Tau-c corr。(最適合長方形桌子):
  • 肯德爾的 Tau-a corr。(不調整關係):

在哪裡- 具有“一致性”的觀察對數,- 帶有“反轉”;- 變量 X 的關係數,- 通過變量 Y,– 通過兩個變量;- 觀察次數,- 該數字較少的變量中不同值的數量。

因此,tau 在理論上和大小上與 Gamma 直接可比。Rho 在理論和量級上與 Pearson 直接可比. Nick Stauner 在這裡的好回答告訴我們如何間接比較 rho 和 tau 。

另請參閱tau 和 rho。

引用自:https://stats.stackexchange.com/questions/18112

comments powered by Disqus