Hypothesis-Testing
Pearson 相關檢驗的 p 值是否可以僅根據相關係數和样本量計算?
**背景:**我讀過一篇文章,其中作者報告樣本大小為 878 的 Pearson 相關性為 0.754。相關性檢驗的結果 p 值為“兩星”顯著(即 p < 0.01)。但是,我認為在如此大的樣本量下,對應的 p 值應該小於 0.001(即三顆星顯著)。
- 可以僅根據 Pearson 相關係數和样本量計算此測試的 p 值嗎?
- 如果是,如何在 R 中做到這一點?
是的,如果您使用 Fisher 的 R-to-z 轉換,它可以做到。其他方法(例如引導程序)可能有一些優勢,但需要原始數據。在 R 中(r是樣本相關係數,n是觀察次數):
z <- 0.5 * log((1+r)/(1-r)) zse <- 1/sqrt(n-3) min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2
另請參閱我博客上的這篇文章。
也就是說,它是 .01 還是 .001 並不重要。正如您所說,這主要是樣本量的函數,並且您已經知道樣本量很大。合乎邏輯的結論是,您甚至可能根本不需要測試(尤其不需要測試相關性為 0 的所謂“零”假設)。使用N = 878,您可以對估計的精度充滿信心並專注於直接解釋它(即在您的領域中是 0.75 大嗎?)。
然而,正式地,當您在 Neyman-Pearson 框架中進行統計測試時,您需要提前指定錯誤級別。因此,如果測試結果確實很重要,並且研究計劃以 0.01 作為閾值,則報告p < .01才有意義,您不應根據獲得的p值機會性地將其設為*p < .001。*這種類型的未公開的靈活性甚至是批評小星星的主要原因之一,更普遍的是,在社會科學中實踐無效假設顯著性檢驗的方式。
另見 Meehl, PE (1978)。理論風險和表格星號:卡爾爵士、羅納德爵士和軟心理學的緩慢進展。諮詢與臨床心理學雜誌, 46 (4), 806-834。(標題包含對這些“明星”的引用,但內容是對顯著性檢驗作用的更廣泛討論。)