Confidence-Interval
置信區間是否真的提供了參數估計不確定性的度量?
我正在閱讀統計學家威廉布里格斯的一篇博文,至少可以說,下面的說法讓我很感興趣。
你怎麼看?
什麼是置信區間?當然,這是一個等式,它將為您的數據提供一個區間。它旨在提供參數估計的不確定性的度量。現在,嚴格按照頻率論理論——我們甚至可以假設它是正確的——關於你手頭的 CI,你唯一能說的就是參數的真實值存在於其中或不存在。這是一個重言式,因此它總是正確的。因此,CI 根本沒有提供不確定性的度量:事實上,計算一個無用的練習。
他相當笨拙地指的是眾所周知的事實,即頻率分析不會用概率分佈模擬我們對未知參數的知識狀態,因此計算了(比如 95%)置信區間(比如 1.2 到 3.4)來自某些數據的總體參數(例如高斯分佈的平均值),然後您無法繼續並聲稱平均值有 95% 的概率落在 1.2 和 3.4 之間。概率是一或零——你不知道是哪個。但是,一般來說,您可以說的是,您計算 95% 置信區間的過程是確保它們在 95% 的時間內包含真實參數值的過程。這似乎足以說明 CI 反映了不確定性。正如大衛考克斯爵士所說†
我們定義了評估證據的程序,這些程序根據它們在重複使用時的表現進行校準。從這個意義上說,它們與其他測量儀器沒有區別。
您可以說的其他內容根據您用於計算置信區間的特定方法而有所不同;如果您確保在給定數據的情況下,內部的值比外部的點更有可能,那麼您可以這樣說(對於常用方法,它通常近似正確)。請參閱此處了解更多信息。
† Cox (2006),統計推斷原理,§1.5.2