p值的兩個定義:如何證明它們的等價性?
我正在閱讀拉里·瓦瑟曼 (Larry Wasserman) 的書All of Statistics以及目前關於 p 值的書(第 187 頁)。讓我先介紹一些定義(我引用):
定義 1帶有拒絕域的檢驗的冪函數 R 定義為 β(θ)=Pθ(X∈R)
測試的大小定義為 α=supθ∈Θ0β(θ)一個測試據說有水平 α 如果它的大小小於或等於 α .這基本上是說 α ,大小是類型 I 錯誤的“最大”概率。 p -value 然後通過(我引用)定義
定義 2假設對於每個 α∈(0,1) 我們有尺碼 α 拒絕域測試 Rα . 然後, p-value=infα:T(Xn)∈Rα
在哪裡 Xn=(X1,…,Xn) .對我來說,這意味著:給定一個特定的 α 有一個測試和拒絕區域 Rα 以便 α=supθ∈Θ0(α)Pθ(T(Xn)∈Rα) . 為了 p -值我只是取所有這些中最小的 α .
問題1如果是這樣的話,我可以明確選擇 α=ϵ 對於任意小 ϵ . 我對定義 2 的錯誤解釋是什麼,即它到底是什麼意思?
現在 Wasserman 連續並聲明一個定理有一個“等價”的定義 p -我熟悉的值(我引用):
定理假設尺寸 α 測試的形式 reject H0⟺T(Xn)≥cα
然後, p-value=supθ∈Θ0Pθ(T(Xn)≥T(xn))在哪裡 xn 是觀察值 Xn .所以這是我的第二個問題:
問題 2我怎樣才能真正證明這個定理?可能是我對定義的誤解 p -值,但我無法弄清楚。
我們有一些多元數據, 從分佈中得出帶有一些未知參數. 注意是樣本結果。
我們想測試一些關於未知參數的假設, 的值在原假設下在集合中.
在空間中,我們可以定義一個拒絕區域,以及這個區域的力量然後定義為. 所以功率是針對特定值計算的的作為樣本結果的概率在拒絕區域 當值是. 顯然功率取決於地區並在選定的.
定義1定義了區域的大小作為所有值的至高無上為了在,所以僅對於在下面. 顯然這取決於地區,所以.
作為依賴於取決於當區域發生變化時,我們有另一個值,這是定義 p 值的基礎:改變區域,但是樣本觀測值仍然屬於該區域,對於每個這樣的區域,計算如上定義並取下確界:. 所以 p 值是所有包含.
然後,該定理只是它的“翻譯”,即區域的情況使用統計數據定義和一個價值你定義一個區域作為. 如果您使用這種類型的區域在上述推理中,定理如下。
編輯因為評論:
@user8:對於定理;如果您按照定理定義拒絕區域,則拒絕區域的大小是一個看起來像的集合對於一些.
找到觀測值的 p 值, IE你必須找到最小的區域,即最大值這樣 仍然包含 ,後者(該區域包含) 等價於(因為區域的定義方式),所以你必須找到最大的這樣
顯然,最大的這樣應該然後集合 supra 變為