Hypothesis-Testing

p值的兩個定義:如何證明它們的等價性?

  • October 15, 2015

我正在閱讀拉里·瓦瑟曼 (Larry Wasserman) 的書All of Statistics以及目前關於 p 值的書(第 187 頁)。讓我先介紹一些定義(我引用):

定義 1帶有拒絕域的檢驗的冪函數 $ R $ 定義為 $$ \beta(\theta)=P_{\theta}(X\in R) $$ 測試的大小定義為 $$ \alpha = \sup_{\theta\in\Theta_0}\beta(\theta) $$ 一個測試據說有水平 $ \alpha $ 如果它的大小小於或等於 $ \alpha $ .

這基本上是說 $ \alpha $ ,大小是類型 I 錯誤的“最大”概率。 $ p $ -value 然後通過(我引用)定義

定義 2假設對於每個 $ \alpha\in(0,1) $ 我們有尺碼 $ \alpha $ 拒絕域測試 $ R_\alpha $ . 然後, $$ p\text{-value}=\inf{\alpha:T(X^n)\in R_\alpha} $$ 在哪裡 $ X^n=(X_1,\dots,X_n) $ .

對我來說,這意味著:給定一個特定的 $ \alpha $ 有一個測試和拒絕區域 $ R_\alpha $ 以便 $ \alpha=\sup_{\theta\in\Theta_{0}(\alpha)}P_\theta(T(X^n)\in R_\alpha) $ . 為了 $ p $ -值我只是取所有這些中最小的 $ \alpha $ .

問題1如果是這樣的話,我可以明確選擇 $ \alpha = \epsilon $ 對於任意小 $ \epsilon $ . 我對定義 2 的錯誤解釋是什麼,即它到底是什麼意思?

現在 Wasserman 連續並聲明一個定理有一個“等價”的定義 $ p $ -我熟悉的值(我引用):

定理假設尺寸 $ \alpha $ 測試的形式 $$ \text{reject } H_0 \iff T(X^n)\ge c_\alpha $$ 然後, $$ p\text{-value} = \sup_{\theta\in\Theta_0}P_{\theta}(T(X^n)\ge T(x^n)) $$ 在哪裡 $ x^n $ 是觀察值 $ X^n $ .

所以這是我的第二個問題:

問題 2我怎樣才能真正證明這個定理?可能是我對定義的誤解 $ p $ -值,但我無法弄清楚。

我們有一些多元數據, 從分佈中得出帶有一些未知參數. 注意是樣本結果。

我們想測試一些關於未知參數的假設, 的值在原假設下在集合中.

在空間中,我們可以定義一個拒絕區域,以及這個區域的力量然後定義為. 所以功率針對特定值計算的的作為樣本結果的概率在拒絕區域 當值是. 顯然功率取決於地區並在選定的.

定義1定義了區域的大小作為所有值的至高無上為了在,所以僅對於在下面. 顯然這取決於地區,所以.

作為依賴於取決於當區域發生變化時,我們有另一個值,這是定義 p 值的基礎:改變區域,但是樣本觀測值仍然屬於該區域,對於每個這樣的區域,計算如上定義並取下確界:. 所以 p 值是所有包含.

然後,該定理只是它的“翻譯”,即區域的情況使用統計數據定義和一個價值你定義一個區域作為. 如果您使用這種類型的區域在上述推理中,定理如下。

編輯因為評論:

@user8:對於定理;如果您按照定理定義拒絕區域,則拒絕區域的大小是一個看起來像的集合對於一些.

找到觀測值的 p 值, IE你必須找到最小的區域,即最大值這樣 仍然包含 ,後者(該區域包含) 等價於(因為區域的定義方式),所以你必須找到最大的這樣

顯然,最大的這樣應該然後集合 supra 變為

引用自:https://stats.stackexchange.com/questions/177113

comments powered by Disqus