Hypothesis-Testing
假設檢驗。為什麼將抽樣分佈集中在 H0 上?
p 值是在假設零假設 () 是真的。
從圖形上看,這對應於在抽樣分佈下由樣本統計量定義的區域,假設該區域將獲得:
然而,因為這個假設分佈的形狀實際上是基於樣本數據,所以它集中在對我來說似乎是一個奇怪的選擇。
如果人們改為使用統計量的抽樣分佈,即以樣本統計量為中心,那麼假設檢驗將對應於估計給定樣本。
在這種情況下,p 值是獲得至少與給定數據而不是上面的定義。
此外,這種解釋具有與置信區間概念很好地關聯的優點:
具有顯著性水平的假設檢驗相當於檢查是否屬於抽樣分佈的置信區間。
因此,我覺得將分佈集中在可能是不必要的並發症。
這一步有什麼我沒有考慮的重要理由嗎?
認為是從均值未知的正態分佈中抽取的樣本和已知方差. 樣本均值因此是正常的,均值和方差. 在這一點上,我認為不可能有分歧。
現在,您建議我們的檢驗統計量是
正確的? 但這不是一個統計數據。為什麼?因為是一個未知參數。統計量是不依賴於任何未知參數的樣本函數。因此,必須假設為了成為一個統計數字。一個這樣的假設是寫在這之下這是一個統計數據。 相比之下,您建議使用本身。在這種情況下,同樣,它甚至不是一個隨機變量,更不用說正態分佈了。沒有什麼可以測試的。