如何正確用詞頻繁置信區間
我知道這有很多很多線程(例如這個優秀的線程)。我可能錯過了它,但我似乎找不到一個能夠真正解釋如何使用區間中包含的實際數字準確報告常客置信度的文章。
所以說我有回歸係數 $ \beta = 3.4 $ 和 $ CI = [0.5, 5.6] $
貝葉斯可信區間
如果 CI 是貝葉斯可信區間,則報告此區間非常簡單:
“給定數據和模型的假設,有 95% 的概率是 $ \beta $ 介於 0.5 和 5.6 之間"
頻率論置信區間
現在我們知道,當區間是置信區間時,正確地報告它更加棘手。根據我讀過的內容,我會冒險
“如果我們進行許多實驗,所構建的 95% 區間中的 95% 將包含 $ \beta $ "
令我困惑的是,CI 中的實際數字並未出現在此解釋中。
在忠實於頻率論者的概率觀點的同時,我如何將平均值或 CI 用於我的效果報告?
您可以通過多種方式合理地表述置信區間陳述,但以下陳述的任何變化都可以。(由於您沒有相反地指定,我假設這是一個 95% 的置信區間。如果不是,那麼您應該在陳述中進行適當的更改。)重要的是您清楚地給出您的置信水平和區間出於興趣。您還應該確保正確區分估計符號和真實參數值的符號。
- 我們對斜率的估計是 $ \hat{\beta} = 3.4 $ ( $ \text{95%CI} = [0.5, 5.6] $ )。
- 以 95% 的置信度,我們推斷真正的斜率值在區間中的某個位置 $ 0.5 \leqslant \beta \leqslant 5.6 $ .
- 以 95% 的信心,我們發現 $ 0.5 \leqslant \beta \leqslant 5.6 $ .
“置信度”的概念在經典統計中具有明確且眾所周知的含義,因此如果您指的是對某個參數落在某個區間內具有一定的置信水平,那麼這將自動被理解為報告置信區間。您無需擔心是否忠於特定框架——實踐中只使用一個概率論框架 $ ^\dagger $ 並且只有一個置信區間的含義。事實上,當其他框架在(例如,貝葉斯推理中的“可信區間”)中提出類似的想法時,它們會確保准確地使用不同的術語以避免在這個主題上產生混淆。
如果您只是在做應用統計工作,則無需指定“信心”的確切統計含義。對於大多數讀者來說,它是微妙而令人困惑的,如果他們感興趣,你可以合理地讓他們有責任閱讀它。許多在任何領域具有應用科學背景的人都會參加一些介紹性統計課程,他們在那裡學習然後忘記了置信區間的含義。大多數讀者只會對統計專業對這一概念給予認可這一事實感到滿意。對於統計專家來說,他們會知道這個概念的確切含義,並且對您的總結報告同樣滿意。
擔心“概率”的正確解釋是從中刪除的另一個順序,這當然不是您在報告數據的統計分析時需要關注的事情。感興趣的讀者如果真的願意,可以深入哲學的兔子洞和概率論的基礎。
$ ^\dagger $ 學術文獻中偶爾有論文檢查“概率”的非標準版本(例如,使用複數等),但這些基本上都是廢話。