P-Value

之間有什麼關係ppp值和 I 類錯誤 [重複]

  • December 18, 2014

在假設檢驗中,我們設置了可接受的第一類錯誤概率水平並觀察如果原假設為真,樣本統計量是否同樣可能或不太可能被觀察到。在零值下觀察樣本分數或更極端的確切概率是價值。更一般地,我們拒絕如果.

我現在想知道以下內容。這value 似乎給出了錯誤拒絕真零假設(如果我們決定這樣做)的概率的精確估計,這類似於 I 類錯誤定義。由於我們知道(估計)觀察樣本得分(或更多極值)的概率,似乎是最大可接受的 I 類錯誤,而是準確的。換句話說,它似乎給出了最小值我們仍然可以拒絕空值的水平。

這個對嗎?

[假設,目前我們不是在談論複合零假設,因為它將簡化討論以堅持更簡單的情況。在復合案例中也可以提出類似的觀點,但由此產生的額外討論可能證明不夠有啟發性]

I 類錯誤的概率,(如果假設成立)由下式給出是重複抽樣概念下的概率。如果您在 null 為真時多次收集數據,從長遠來看,那些你會拒絕的時候。實際上,它會在您採樣之前告訴您 I 類錯誤的概率。

p 值是特定於實例且有條件的。它不會告訴您 I 類錯誤的概率,無論是在您採樣之前(它無法告訴您,因為它取決於樣本),還是之後:

如果那麼你犯第一類錯誤的機會為零。

如果 null 為真並且那麼你犯 I 類錯誤的機會是 1。

再看一下正在討論的兩件事:

  • P(I 類錯誤) = P(拒絕 H|H真的)
  • p 值 = P(樣本結果至少與觀察到的樣本值一樣極端|H真實,樣本)

它們是不同的東西。


編輯 - 從評論看來,有必要詳細說明您的第二段:

p 值似乎給出了錯誤拒絕真零假設的概率的準確估計

並非如此,如上所述。(我認為這足以使問題的其餘部分變得毫無意義。)

α 似乎是最大可接受的 I 類錯誤,

實際上,是的(當然我們可以選擇更低的由於各種原因,我們準備接受的絕對最高費率)。

而 p 是精確的。

同樣,不是這樣;它不等於在建議的意義上。正如我所建議的,條件概率中的分子和分母都不同於.

換句話說,它似乎給出了我們仍然可以拒絕零的最小 α 水平。

儘管我之前有過警告,但有一種直接的(不一定特別有趣)的感覺是正確的。注意在測試之前選擇,後觀察,因此有必要從我們通常的情況轉變。

如果我們假設以下反事實:

  • 我們有一假設檢驗器,每個檢驗器都在自己的顯著性水平上運行
  • 他們每個人都呈現相同的數據集

那麼p值就是那些拒絕和接受的測試者之間的分界線。從這個意義上說,p 值是測試人員仍然可以拒絕空值的最小 α 水平。但在真實的測試情況下,是固定的,而不是可變的,並且我們正在處理的概率是 0 或 1(在某種程度上類似於人們所說的“置信區間包含參數的概率”)。

我們的概率陳述是指重複抽樣;如果我們設置一組測試人員,每個測試人員都有他們的個人,並且只考慮一個數據集來測試一個,不清楚是在那種情況下發生任何事情的概率 - 相反,如果我們有一組測試人員並在 null 為真的情況下重複抽樣,則表示某些東西——他們每個人都會拒絕一個比例它們在樣本中的零值,而將代表每個樣本的某些內容。

引用自:https://stats.stackexchange.com/questions/129628

comments powered by Disqus