Hypothesis-Testing
有沒有一種有用的方法來定義“最佳”置信區間?
(比如說)95% 置信區間 (CI) 的標准定義只要求它包含真實參數的概率為 95%。顯然,這不是唯一的。我所見過的語言表明,在許多有效的 CI 中,找到最短的、對稱的或即使某些分佈參數未知的情況下也能精確知道等的東西通常是有意義的。換句話說,似乎沒有CI比其他“更好”的明顯層次結構。
但是,我認為 CI 的一個等效定義是它由所有值組成,這樣在看到實現的樣本後,真實參數等於該值的零假設不會在適當的顯著性水平上被拒絕。這表明只要選擇自己喜歡的測試,就可以自動構建 CI。並且基於UMP(或無偏測試中的UMP)概念的測試之間存在標準偏好。
將 CI 定義為對應於 UMP 測試或類似的東西有什麼好處嗎?
有點長的評論。查看Morey 等人在本文“置信區間置信的謬誤”中對 UMP 的討論。特別是,有一些例子:
“更奇怪的是,UMP 程序的間隔最初隨著數據的不確定性而增加,但是當可能性的寬度大於 5 米時,UMP 間隔的寬度與數據的不確定性成反比,像非參數區間一樣。UMP 和抽樣分佈程序有一個可疑的區別,即它們的 CI 不能用於回溯到觀察結果。儘管是“最強大”的程序,但 UMP 程序顯然會丟棄重要信息。”