Hypothesis-Testing

p=5.0% 顯著嗎?

  • December 16, 2013

今天有人問我,0.05(精確)的 p 值是否被認為是顯著的(給定 alpha=5%)。我不知道答案,谷歌找到了兩個答案:(a)如果 p 小於 5%,結果是顯著的;(b)如果 p 小於 5% 或等於 5%。

當然,這些網站都沒有引用任何人。為什麼要一個-這是常識,無論如何,這5%是任意的。但這無助於我告訴我的學生一些要記住的事情。

所以,這是我關於檢驗假設的絕望問題:如果 p 值恰好是 alpha - 我是否認為結果顯著?在這種情況下,權威引用是什麼?

非常感謝你

拋開一些實際問題(例如是任意的,例如),顯著性水平和 p 值的定義使這個問題的答案明確。

也就是說,正式的拒絕規則是你拒絕什麼時候.

它真的應該只對離散情況很重要,但在那種情況下,如果你不拒絕什麼時候,你的第一類錯誤率實際上不會是!

(就我而言,沒有“權威”的引用;你真的需要掌握 Neyman-Pearson 和 Fisherian 的假設檢​​驗方法,這是隨著時間的推移而發展起來的。)

有許多好的統計文本可以正確描述假設檢驗。

p值的定義在相關維基百科文章的第一句話中給出了正確的*:

p 值是在假設原假設為真的情況下,獲得至少與實際觀察到的統計量一樣極端的檢驗統計量的概率。

*(不,維基百科不是權威,我只是說定義是正確的)

為簡單起見,讓我們堅持使用空點;它有助於理解這一點,而不會因其他問題而混淆水域。

現在顯著性水平,是選擇的第一類錯誤率。這是您選擇在其為真時拒絕原假設的比率。也就是說,它是您應該拒絕空值的時間比例。現在考慮一個離散分佈的檢驗統計量——唯一一次確切地說_ 實際上是可能的**。(通常情況下,實際的 alpha 值也會與 5% 之類的圓潤的值不同。)

** 好吧,我想我的討論僅限於純離散或純連續分佈式測試統計。在混合情況下,您可以弄清楚我的離散討論如何適用(在適用的情況下)。

例如考慮一個雙尾符號測試, 說。最接近 5% 的可實現顯著性水平是 4.904%。所以讓我們選擇(或者更準確地說,)。

所以當是真的,如果我們在什麼時候拒絕,拒絕率是多少? 我們可以解決這個問題。這是 4.904% - 這是我們選擇了。

另一方面,當是真的,如果我們什麼時候不拒絕,拒絕率是多少? 我們可以解決這個問題。只有1.27%。遠遠低於. 那不是我們報名參加的考試!

也就是說,如果我們的測試(很明顯!)具有所需的屬性,如果是在拒絕區域。

[現在讓我們考慮一下你的情況。你的 p 值實際上是 5% 嗎?我敢打賭,由於幾個不同的原因,事實並非如此。但無論如何,你可以正式聲明,是拒絕。]

如果您預先描述您的拒絕規則並表明(如果滿足假設),它具有所需的顯著性水平,那麼可能不需要參考。

拒絕規則只是關於測試統計量的哪些值將導致您拒絕的陳述. 它等同於定義拒絕區域(參見 Casella 和 Berger,Statistical Inference,p346,它用簡單的術語定義了術語拒絕區域)。

同一本書以與維基百科不同的術語定義了 p 值 (p364)(但結果含義相同)——也就是說,它將它定義為(對於給定的數據集),最小的這將導致拒絕null。

(如果您有不同的版本,頁碼可能會更改,但它有一個索引,因此您可以查找術語;請注意,您可能需要查看“假設檢驗”下的列表或索引中的類似內容以查找’拒絕區域')

嗯,讓我們試試現成的另一本書。Wackerly, Mendenhall & Scheaffer Mathematical Statistics with Applications,第 5 版,在 p412 上定義了一個拒絕區域,在 p431 上定義了一個 p 值(與 C&B 相同的定義)。

引用自:https://stats.stackexchange.com/questions/79855

comments powered by Disqus