p值的兩個定義：如何證明它們的等價性？

October 15, 2015

我正在閱讀拉里·瓦瑟曼 (Larry Wasserman) 的書All of Statistics以及目前關於 p 值的書（第 187 頁）。讓我先介紹一些定義（我引用）：

定義 1帶有拒絕域的檢驗的冪函數 $ R $ 定義為 $$ \beta(\theta)=P_{\theta}(X\in R) $$ 測試的大小定義為 $$ \alpha = \sup_{\theta\in\Theta_0}\beta(\theta) $$ 一個測試據說有水平 $ \alpha $ 如果它的大小小於或等於 $ \alpha $ .

這基本上是說 $ \alpha $ ，大小是類型 I 錯誤的“最大”概率。 $ p $ -value 然後通過（我引用）定義

定義 2假設對於每個 $ \alpha\in(0,1) $ 我們有尺碼 $ \alpha $ 拒絕域測試 $ R_\alpha $ . 然後， $$ p\text{-value}=\inf{\alpha:T(X^n)\in R_\alpha} $$ 在哪裡 $ X^n=(X_1,\dots,X_n) $ .

對我來說，這意味著：給定一個特定的 $ \alpha $ 有一個測試和拒絕區域 $ R_\alpha $ 以便 $ \alpha=\sup_{\theta\in\Theta_{0}(\alpha)}P_\theta(T(X^n)\in R_\alpha) $ . 為了 $ p $ -值我只是取所有這些中最小的 $ \alpha $ .

問題1如果是這樣的話，我可以明確選擇 $ \alpha = \epsilon $ 對於任意小 $ \epsilon $ . 我對定義 2 的錯誤解釋是什麼，即它到底是什麼意思？

現在 Wasserman 連續並聲明一個定理有一個“等價”的定義 $ p $ -我熟悉的值（我引用）：

定理假設尺寸 $ \alpha $ 測試的形式 $$ \text{reject } H_0 \iff T(X^n)\ge c_\alpha $$ 然後， $$ p\text{-value} = \sup_{\theta\in\Theta_0}P_{\theta}(T(X^n)\ge T(x^n)) $$ 在哪裡 $ x^n $ 是觀察值 $ X^n $ .

所以這是我的第二個問題：

問題 2我怎樣才能真正證明這個定理？可能是我對定義的誤解 $ p $ -值，但我無法弄清楚。

我們有一些多元數據, 從分佈中得出帶有一些未知參數. 注意是樣本結果。

我們想測試一些關於未知參數的假設, 的值在原假設下在集合中.

在空間中，我們可以定義一個拒絕區域，以及這個區域的力量然後定義為. 所以功率是針對特定值計算的的作為樣本結果的概率在拒絕區域 當值是. 顯然功率取決於地區並在選定的.

定義1定義了區域的大小作為所有值的至高無上為了在，所以僅對於在下面. 顯然這取決於地區，所以.

作為依賴於取決於當區域發生變化時，我們有另一個值，這是定義 p 值的基礎：改變區域，但是樣本觀測值仍然屬於該區域，對於每個這樣的區域，計算如上定義並取下確界：. 所以 p 值是所有包含.

然後，該定理只是它的“翻譯”，即區域的情況使用統計數據定義和一個價值你定義一個區域作為. 如果您使用這種類型的區域在上述推理中，定理如下。

編輯因為評論：

@user8：對於定理；如果您按照定理定義拒絕區域，則拒絕區域的大小是一個看起來像的集合對於一些.

找到觀測值的 p 值， IE你必須找到最小的區域，即最大值這樣 仍然包含 ，後者（該區域包含) 等價於（因為區域的定義方式），所以你必須找到最大的這樣

顯然，最大的這樣應該然後集合 supra 變為

引用自：https://stats.stackexchange.com/questions/177113

comments powered by Disqus

p值的兩個定義：如何證明它們的等價性？

編輯因為評論：

相關問答

對於所有類型的分佈，均值的 CDF 是否始終為 0.5？

關於文章“拋棄 p 值。改用 Bootstrap 置信區間”的三個問題

我可以比較 p 值嗎？

離散變量和連續變量。定義是什麼？

Westfall 說，“峰度的比例由中央決定μ±σμ±σmupmsigma範圍通常很小”但反過來是真的嗎？

如果是是Y獨立於X1X1X_{1}和X2X2X_{2}, 是否表明是是Y也獨立於X1+X2X1+X2X_{1}+X_{2}?