Tables

要放入表格中的有效數字的數量?

  • March 24, 2011

對於要發布的有效數字的數量,是否有一個有根據的規則?

以下是一些具體的例子/問題:

  • 有沒有辦法將有效數字的數量與變異係數聯繫起來?例如,如果估計值為 12.3,CV 為 50%,這是否意味著 ‘.3’ 表示的信息接近於零?
  • 如果置信區間有一個數量級的範圍,它們是否仍然具有相同數量的有效數字,例如:

12.3 (1.2, 123.4) 與 12 (1.2, 120)

  • 誤差估計中的有效數字的數量應該與平均值中的有效數字的數量相同還是更少?

我懷疑有一個普遍的規則,所以我不會編造任何東西。我可以分享這些想法及其背後的原因:

  • 當摘要反映數據本身時(最大值、最小值、順序統計等),首先使用相同數量的有效數字來記錄數據。這在整個文檔中提供了關於數據精度的一致表示。
  • 當摘要的精度高於數據時,以反映額外精度的方式寫入值。例如,一個平均值價值觀有乘以單個值的精度:粗略地,包括一個額外的有效數字,兩個為等(顯然,這是在對數 10 範圍內四捨五入的。)
  • 請注意,簡歷沒有提供這方面的有用信息。

  • 一些估計可以非常精確地獲得。他們不必四捨五入來匹配其他東西。例如,1,000,000 個整數的平均值可能為 10.977,標準誤差為 0.00301。我決定將平均值寫到小數點後三位(和 4-5 sig figs)是基於 SE 的數量級,這表明最後一位數字是部分可靠的。將 SE 寫入三個 sig fig(小數點後五位)的決定更加隨意:兩個 sig fig 可以;一個可能不會;四個 sig figs 也可以工作,並且與 4-5 sig figs 的平均值一致;超過四個 sig fig 將是矯枉過正。(可以根據數據的四階矩來估計 SE 本身的標準誤差,並用它來確定適當的捨入量,但我們大多數人都不會這麼麻煩……)

  • 在進行大量舍入時向讀者發出信號當報告討論統計檢驗本身時要特別小心。原因是人們可能會使用您的工作來檢查他們自己的計算。有時,即使是細微的差別也能揭示錯誤。您不想因為您將 123 舍入到 120 而造成麻煩,而其他人在檢查工作時得到 123 並懷疑你們中的一個人犯了錯誤。
  • 保持一致。如果您一次將一個值列為 123,然後將其引用為 120,您可能會失去一些讀者。
  • 不要荒謬。(例如,當數據只有兩個 sig figs 時,當我遇到將統計結果提供給 15 sig figs 的報告時,我會自動懷疑無能。)

引用自:https://stats.stackexchange.com/questions/8734

comments powered by Disqus

相關問答