如何比較兩個 Pearson 相關性的強度?
一位審稿人問我是否可以將表格中顯示的 Pearson 相關性(r 值)相互比較,以便可以聲稱一個比另一個“更強”(而不是僅僅關注實際的 r 值) .
你會怎麼做?我找到了這個方法
http://vassarstats.net/rdiff.html
但我不確定這是否適用。
(我假設您說的是從樣本中獲得的r 。)
該網站上的測試適用於它將r視為任何參數,其值在兩個群體之間可能不同。r與任何其他度量有什麼不同,例如平均值,您非常有信心使用t檢驗進行比較?嗯,它的不同之處在於它在-1,1 之間,它沒有正確的分佈,所以你需要在進行推理之前對其進行Fisher 變換(如果你想獲得CI,則在之後對其進行變換)。測試得出的 z 分數確實具有可以進行推斷的適當形式。這就是您鏈接到的測試正在做的事情。
所以你鏈接到的是一個推斷如果你能得到你抽樣的整個人口的r可能會發生什麼的過程 - 一個組的**r是否會高於另一組,或者會它們完全一樣嗎?讓我們稱其為後面的假設 H. 如果測試返回的p值較低,這意味著根據您的樣本,您應該對兩個r之間的差異的真實值恰好為 0 的假設幾乎沒有信心(因為這樣的數據很少出現,如果r的差值正好為 0)。如果不是,則您沒有數據可以自信地拒絕這個精確等於r的假設,因為它是正確的和/或因為您的樣本不足。請注意,我本可以對均值差異(使用t檢驗)或任何其他度量值進行相同的描述。
一個完全不同的問題是兩者之間的差異是否有意義。可悲的是,對此沒有直接的答案,也沒有統計測試可以給你答案。也許r的真實值(總體值,而不是您觀察到的值)在一個組中是 0.5,在另一組中是 0.47。在這種情況下,它們等價的統計假設(我們的 H) 將是錯誤的。但這是一個有意義的區別嗎?這取決於 - 大約 3% 的解釋方差是有意義的還是無意義的?Cohen 給出了解釋r的粗略指南(並且可能是r之間的差異),但只是在這些只是一個起點的建議下才這樣做。而且您甚至不知道確切的差異,即使您進行了一些推斷,例如通過計算兩個相關之間差異的 CI。很可能,一系列可能的差異將與您的數據兼容。
一個相對安全的賭注是計算您的r的置信區間,並可能計算它們的差異的 CI,並讓讀者決定。