Hypothesis-Testing

p值的兩個定義:如何證明它們的等價性?

  • October 15, 2015

我正在閱讀拉里·瓦瑟曼 (Larry Wasserman) 的書All of Statistics以及目前關於 p 值的書(第 187 頁)。讓我先介紹一些定義(我引用):

定義 1帶有拒絕域的檢驗的冪函數 R 定義為 β(θ)=Pθ(XR)

測試的大小定義為 α=supθΘ0β(θ)
一個測試據說有水平 α 如果它的大小小於或等於 α .

這基本上是說 α ,大小是類型 I 錯誤的“最大”概率。 p -value 然後通過(我引用)定義

定義 2假設對於每個 α(0,1) 我們有尺碼 α 拒絕域測試 Rα . 然後, p-value=infα:T(Xn)Rα

在哪裡 Xn=(X1,,Xn) .

對我來說,這意味著:給定一個特定的 α 有一個測試和拒絕區域 Rα 以便 α=supθΘ0(α)Pθ(T(Xn)Rα) . 為了 p -值我只是取所有這些中最小的 α .

問題1如果是這樣的話,我可以明確選擇 α=ϵ 對於任意小 ϵ . 我對定義 2 的錯誤解釋是什麼,即它到底是什麼意思?

現在 Wasserman 連續並聲明一個定理有一個“等價”的定義 p -我熟悉的值(我引用):

定理假設尺寸 α 測試的形式 reject H0T(Xn)cα

然後, p-value=supθΘ0Pθ(T(Xn)T(xn))
在哪裡 xn 是觀察值 Xn .

所以這是我的第二個問題:

問題 2我怎樣才能真正證明這個定理?可能是我對定義的誤解 p -值,但我無法弄清楚。

我們有一些多元數據, 從分佈中得出帶有一些未知參數. 注意是樣本結果。

我們想測試一些關於未知參數的假設, 的值在原假設下在集合中.

在空間中,我們可以定義一個拒絕區域,以及這個區域的力量然後定義為. 所以功率針對特定值計算的的作為樣本結果的概率在拒絕區域 當值是. 顯然功率取決於地區並在選定的.

定義1定義了區域的大小作為所有值的至高無上為了在,所以僅對於在下面. 顯然這取決於地區,所以.

作為依賴於取決於當區域發生變化時,我們有另一個值,這是定義 p 值的基礎:改變區域,但是樣本觀測值仍然屬於該區域,對於每個這樣的區域,計算如上定義並取下確界:. 所以 p 值是所有包含.

然後,該定理只是它的“翻譯”,即區域的情況使用統計數據定義和一個價值你定義一個區域作為. 如果您使用這種類型的區域在上述推理中,定理如下。

編輯因為評論:

@user8:對於定理;如果您按照定理定義拒絕區域,則拒絕區域的大小是一個看起來像的集合對於一些.

找到觀測值的 p 值, IE你必須找到最小的區域,即最大值這樣 仍然包含 ,後者(該區域包含) 等價於(因為區域的定義方式),所以你必須找到最大的這樣

顯然,最大的這樣應該然後集合 supra 變為

引用自:https://stats.stackexchange.com/questions/177113