如何選擇置信度?
我經常使用 90% 的置信水平,接受它比 95% 或 99% 具有更大程度的不確定性。
但是有沒有關於如何選擇正確的置信水平的指導方針?或者不同領域使用的置信水平指南?
此外,在解釋和呈現置信水平時,是否有任何指南可以將數字轉化為語言?例如,像這樣的 Pearson’s r 指南(**編輯:**這些描述適用於社會科學):
http://faculty.quinnipiac.edu/libarts/polsci/Statistics.html(2020年 12 月 26 日頁面無響應)
更新
感謝下面的答案。他們都非常有幫助、有見地和有啟發性。
此外,以下是我在研究這個問題時遇到的一些關於選擇顯著性水平(本質上是同一個問題)的好文章。他們驗證了以下答案中所說的內容。
- 0.05顯著性有什麼意義?在 p-value.info 上(2013 年 1 月 6 日);
- 關於 .05 統計顯著性水平的起源 (PDF);
- 科學方法: Regina Nuzzo 的統計錯誤,《自然新聞與評論》,2014 年 2 月 12 日。
除了蒂姆的出色回答之外,甚至在一個領域內,特定置信區間的原因也不同。例如,在髮膠的臨床試驗中,您可能希望非常確信您的治療不太可能殺死任何人,例如 99.99%,但您的髮膠使頭髮留住的置信區間為 75%,您會完全沒問題直的。
一般而言,置信區間的使用方式應使您對不確定性感到滿意,但也不應過於嚴格,以免將您的研究能力降低到無關緊要的程度。90% 的置信區間意味著在重複採樣時,您會期望在 10 個區間中生成的一次將不包括真實值。根據您的研究,這可以接受嗎?另一方面,如果您更喜歡 99% 的置信區間,那麼您的樣本量是否足以讓您的區間不會變得無用大?(希望您在進行研究之前決定 CI 水平,對吧?)
根據我(在社會科學領域)和我妻子(在生物科學領域)的經驗,雖然在各個領域和各種具體案例中都有 CI/顯著性標準,但對於關於一個主題的大多數爭論是您是否適當地設置了 CI 間隔或顯著性水平。我參加過一些會議,一位統計學家耐心地向客戶解釋說,雖然他們可能喜歡 99% 的雙邊置信區間,但為了讓他們的數據顯示出顯著性,他們必須將樣本增加十倍;我參加過會議,客戶問為什麼他們的數據沒有顯示出顯著差異,我們耐心地向他們解釋這是因為他們選擇了高間隔 - 或者相反,一切都很重要,因為要求的間隔較低。
我的建議是閱讀您所在領域的一些主要論文(盡可能接近您的特定主題)並查看它們的用途;將其與您的舒適度和样本量相結合;然後準備好用手頭的信息捍衛你選擇的東西。除非你在一個規則非常嚴格的領域——我懷疑臨床試驗是唯一真正如此嚴格的,至少從我所看到的來看——你不會得到更好的。(如果有嚴格的規定,我希望你所在領域的主要論文都能遵守!)