Confidence-Interval
確切地說,置信區間是什麼?
我粗略且非正式地知道置信區間是什麼。但是,我似乎無法理解一個相當重要的細節:根據維基百科:
給定實際獲得的數據,置信區間並不預測參數的真實值具有處於置信區間內的特定概率。
我還在這個網站的幾個地方看到了類似的觀點。同樣來自維基百科的更正確的定義是:
如果置信區間是在重複(並且可能不同)實驗的許多單獨數據分析中構建的,則包含參數真實值的此類區間的比例將大致匹配置信水平
再一次,我在這個網站的幾個地方看到了類似的觀點。我不明白。如果在重複實驗下,計算的置信區間中包含真實參數的部分是,那麼這個概率是多少是否在為實際實驗計算的置信區間內? 我正在尋找以下答案:
- 澄清上述不正確和正確定義之間的區別。
- 置信區間的正式、精確定義,清楚地表明第一個定義為什麼是錯誤的。
- 一個具體的例子,即第一個定義是非常錯誤的,即使基礎模型是正確的。
在考慮置信區間時,我發現這個思想實驗很有幫助。它也回答了你的問題 3。
讓和. 考慮兩個觀察結果取值和對應於觀察和的, 然後讓和. 然後是 50% 的置信區間(因為區間包括如果或者, 每個都有概率)。
然而,如果那麼我們知道區間包含的概率是, 不是. 微妙之處在於參數的置信區間意味著區間的端點(它們是隨機變量)以概率位於參數的任一側 在計算區間之前,並不是參數位於區間內的概率是 在你計算了間隔之後。