Pearson 相關檢驗的 p 值是否可以僅根據相關係數和样本量計算？

June 6, 2013

**背景：**我讀過一篇文章，其中作者報告樣本大小為 878 的 Pearson 相關性為 0.754。相關性檢驗的結果 p 值為“兩星”顯著（即 p < 0.01）。但是，我認為在如此大的樣本量下，對應的 p 值應該小於 0.001（即三顆星顯著）。

可以僅根據 Pearson 相關係數和样本量計算此測試的 p 值嗎？

如果是，如何在 R 中做到這一點？

是的，如果您使用 Fisher 的 R-to-z 轉換，它可以做到。其他方法（例如引導程序）可能有一些優勢，但需要原始數據。在 R 中（r是樣本相關係數，n是觀察次數）：
z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2
另請參閱我博客上的這篇文章。

也就是說，它是 .01 還是 .001 並不重要。正如您所說，這主要是樣本量的函數，並且您已經知道樣本量很大。合乎邏輯的結論是，您甚至可能根本不需要測試（尤其不需要測試相關性為 0 的所謂“零”假設）。使用N = 878，您可以對估計的精度充滿信心並專注於直接解釋它（即在您的領域中是 0.75 大嗎？）。

然而，正式地，當您在 Neyman-Pearson 框架中進行統計測試時，您需要提前指定錯誤級別。因此，如果測試結果確實很重要，並且研究計劃以 0.01 作為閾值，則報告p < .01才有意義，您不應根據獲得的p值機會性地將其設為*p < .001。*這種類型的未公開的靈活性甚至是批評小星星的主要原因之一，更普遍的是，在社會科學中實踐無效假設顯著性檢驗的方式。

另見 Meehl, PE (1978)。理論風險和表格星號：卡爾爵士、羅納德爵士和軟心理學的緩慢進展。諮詢與臨床心理學雜誌， 46 (4), 806-834。（標題包含對這些“明星”的引用，但內容是對顯著性檢驗作用的更廣泛討論。）

引用自：https://stats.stackexchange.com/questions/61026

comments powered by Disqus

Pearson 相關檢驗的 p 值是否可以僅根據相關係數和样本量計算？

相關問答

無因果關係

為什麼在計算自相關時減去平均值？

關於文章“拋棄 p 值。改用 Bootstrap 置信區間”的三個問題

我可以比較 p 值嗎？

標準正態隨機變量的乘積符號

為什麼多重共線性與相關性不同？