Confidence-Interval
計算“實際覆蓋概率”與計算“可信區間”是否相同?
我正在閱讀入門級統計教科書。在二項分佈數據成功率的最大似然估計一章中,給出了一個計算置信區間的公式,然後漫不經心地提到
考慮它的實際覆蓋概率,即該方法產生捕獲真實參數值的區間的概率。這可能比標稱值小很多。
並繼續提出構建替代“置信區間”的建議,該區間可能包含實際的覆蓋概率。
我第一次遇到名義和實際覆蓋概率的概念。通過這裡的老問題,我想我已經理解了:有兩個不同的概念,我們稱之為概率,第一個是尚未發生的事件產生給定結果的可能性有多大,第二個是觀察者對已經發生的事件結果的猜測是正確的可能性有多大。似乎置信區間僅測量第一類概率,而所謂的“可信區間”測量第二類概率。我概括地假設置信區間是計算“名義覆蓋概率”的區間,而可信區間是覆蓋“實際覆蓋概率”的區間。
但也許我誤解了這本書(它提供的不同計算方法是針對置信區間和可信區間,還是針對兩種不同類型的置信區間,尚不完全清楚),或者我曾經來過的其他來源我目前的理解。特別是我對另一個問題的評論,
常客的置信區間,貝葉斯的可信區間
讓我懷疑我的結論,因為這本書在那一章中沒有描述貝葉斯方法。
所以請澄清我的理解是否正確,或者我是否在途中犯了邏輯錯誤。
通常,當您使用離散分佈時,實際覆蓋概率永遠不會等於名義概率。
置信區間定義為數據的函數。如果您使用二項式分佈,則只有有限多個可能的結果(準確地說),所以只有有限多個可能的置信區間。由於參數是連續的,很容易看出覆蓋概率(它是) 只能達到大約 95%(或其他)。
通常,基於 CLT 的方法的覆蓋概率低於標稱值,但其他方法實際上可能更保守。