Hypothesis-Testing

p 值的微妙之處：更大等於與更大

November 26, 2014

當我閱讀 Wassermann 的《所有統計》一書時，我注意到 p 值的定義中有一個微妙之處，我無法理解。非正式地，Wassermann 將 p 值定義為

[..] 概率（在) 觀察到的檢驗統計量值與實際觀察到的值相同或更極端。

重點補充。更正式的相同（定理 10.12）：

假設尺寸測試的形式

拒絕當且僅當.

然後，

在哪裡是觀察值. 如果然後

此外，Wassermann 定義了 Pearson 的 p 值測試（和其他類似的測試）為：

我想要求澄清的部分是更大的平等（) 簽入第一個和更大的 () 在第二個定義中籤名。我們為什麼不寫, 哪個會匹配 " same as or moreextreme?“的第一個引號？

這是否非常方便，因此我們將 p 值計算為? 我注意到 R 也將定義與簽署，例如，在chisq.test。

“作為或更極端”是正確的。

那麼，正式地，如果分佈使得獲得檢驗統計量本身的概率為正，則該概率（以及任何同樣極端的情況，例如另一條尾部的相應值）應該包含在 p 值中。

當然，對於連續統計，完全相等的概率為 0。如果我們說沒有區別或者.

引用自：https://stats.stackexchange.com/questions/125542

comments powered by Disqus

相關問答

Hypothesis-Testing

這是p-hacking嗎？

February 3, 2022

Hypothesis-Testing

關於文章“拋棄 p 值。改用 Bootstrap 置信區間”的三個問題

November 9, 2021

Hypothesis-Testing

我可以比較 p 值嗎？

November 2, 2021

為什麼當平均值看起來真的不同時，t.test() 的 p 值在統計上不顯著

April 6, 2021

Hypothesis-Testing

為什麼均值 ± 2*SEM（95% 置信區間）重疊，但 p 值為 0.05？

November 21, 2020

如果您多次執行相同的測試，您可以將 p 值相乘嗎？

October 9, 2020