Statistical-Significance

“科學家起來反對統計意義”是什麼意思?(自然評論)

  • March 21, 2019

《自然科學家評論》的標題反對統計意義的開頭是:

Valentin Amrhein、Sander Greenland、Blake McShane 和 800 多名簽署者呼籲結束大肆宣傳並消除可能的關鍵影響。

後來包含如下語句:

同樣,我們並不提倡禁止 P 值、置信區間或其他統計措施——只是我們不應該斷然對待它們。這包括統計顯著與否的二分法,以及基於其他統計度量(如貝葉斯因子)的分類。

我想我可以理解,下圖並沒有說這兩項研究不同意,因為一項“排除”沒有效果,而另一項則沒有。但是這篇文章似乎比我能理解的要深入得多。

到最後似乎有四點總結。對於我們這些閱讀而不是編寫統計數據的人來說,是否可以用更簡單的術語來總結這些?

在談論兼容性間隔時,請記住四件事。

  • 首先,僅僅因為區間給出了與數據最兼容的值,給定假設,並不意味著它之外的值是不兼容的;他們只是不太兼容……
  • 其次,考慮到假設,並非所有內部值都與數據同樣兼容……
  • 第三,就像它來自的 0.05 閾值一樣,用於計算間隔的默認 95% 本身就是一個任意約定……
  • 最後,也是最重要的一點,保持謙虛:兼容性評估取決於用於計算區間的統計假設的正確性……

自然:科學家們反對統計意義

據我所知,前三點是單個論點的變體。

科學家經常處理不確定性測量( $ 12 \pm 1 $ ,例如)作為如下所示的概率分佈*:*

均勻概率分佈

實際上,它們更有可能看起來像這樣在此處輸入圖像描述

作為一名前化學家,我可以確認,許多具有非數學背景的科學家(主要是非物理化學家和生物學家)並不真正了解不確定性(或他們所說的錯誤)應該如何起作用。他們回憶起本科物理的時候,他們可能不得不使用它們,甚至可能不得不通過幾種不同的測量來計算複合誤差,但他們從來沒有真正理解過它們。我也對此感到內疚,並假設所有測量值必須在 $ \pm $ 間隔。直到最近(以及學術界之外),我才發現誤差測量通常指的是某個標準偏差,而不是絕對限制。

因此,分解文章中的編號點:

  1. CI 之外的測量仍然有可能發生,因為那裡的真實(可能是高斯)概率是非零的(或者在任何地方,儘管當你遠離時它們會變得非常小)。如果後面的值 $ \pm $ 確實代表一個 sd,那麼數據點仍有 32% 的機會落在它們之外。
  2. 分佈不均勻(平頂,如第一張圖所示),呈峰值。與邊緣相比,您更有可能在中間獲得價值。這就像擲一堆骰子,而不是一個骰子。
  3. 95% 是一個任意的截止值,幾乎與兩個標準偏差一致。
  4. 這一點更多的是對一般學術誠實的評論。我在攻讀博士學位期間的一個認識是,科學不是某種抽象的力量,而是人們試圖從事科學工作的累積努力。這些人試圖發現關於宇宙的新事物,但同時也試圖讓他們的孩子吃飽並保住工作,不幸的是,在現代,這意味著某種形式的出版或滅亡正在發揮作用。實際上,科學家依賴於既真實有趣的發現,因為無趣的結果不會導致發表。

任意閾值,例如 $ p < 0.05 $ 通常可以自我延續,特別是在那些不完全理解統計數據並且只需要在他們的結果上加上通過/失敗標記的人中。因此,人們有時會半開玩笑地談論“再次運行測試,直到你得到 $ p < 0.05 $ ‘。這可能非常誘人,特別是如果博士/助學金/就業取決於結果,那麼這些邊際結果會一直搖擺不定,直到理想 $ p = 0.0498 $ 分析中出現。

這種做法可能對整個科學有害,特別是如果它被廣泛使用,所有這些都是為了追求一個在自然眼中毫無意義的數字。這部分實際上是在勸告科學家對他們的數據和工作誠實,即使這種誠實對他們不利。

引用自:https://stats.stackexchange.com/questions/398646

comments powered by Disqus