Measurement-Error

偏差、系統偏差和系統誤差之間的區別?

  • November 25, 2011

以下術語之間有什麼區別還是相同?

  1. 偏見
  2. 系統偏差
  3. 系統性錯誤

如果存在一些差異,請解釋它們。當增加樣本量時可以減少這些錯誤嗎?

更新: 我感興趣的領域是統計推斷。我的意思是說,作為統計學家,我們如何區分這些術語。

“偏差”一詞在統計基礎文獻中以兩種方式出現:

  1. “……偏見 ,有時稱為系統誤差,…” [EL Lehmann, Theory of Point Estimation, 1983. 這是經典文本。] 在 Lehmann 的符號中,這是標準的,是由參數給出分佈時的期望值,是一個估計器,是一個觀察,並且是要估計的分佈的屬性(估計值)。換句話說,觀察(或其序列)是一個隨機變量,它使估計隨機,而偏差是估計與估計之間的預期偏差。它取決於(未知但真實的)分佈,使其成為真實分佈的函數。Lehmann 用一整章的篇幅介紹了無偏估計量:無論.
  2. 在測量理論中,“偏差”(或“系統誤差”)是測量期望值與真實基礎值之間的差異。例如,校準誤差或儀器漂移可能會導致偏差。將此用法與以前的用法進行對比:在這裡,偏差是測量的屬性,它是一個物理過程,而在此之前,它是統計估計器的屬性(這是從數據中進行猜測的數學定義程序)。

“系統偏差”似乎僅在將偏差與隨機“錯誤”區分開來時使用:術語“錯誤”往往主要用於具有零期望的隨機項。

在許多情況下,隨著數據量的增加,第一種意義上的偏差會減少:實際上,隨著數據量的增加,許多有偏差的估計器的偏差會越來越小(儘管這在理論上並不能保證,因為偏差的概念是如此廣泛)。一個很好的例子是分佈方差的最大似然估計,當獨立抽獎從該分佈中可用。ML 估計量是

為了. 眾所周知,這是有偏見的;估計者是公正的。從何而來,如,變得漸近無偏。

然而,測量環境中的偏差(第二種意義)通常無法通過進行更多測量來減少:偏差是測量過程本身固有的。人們必須通過校準測量程序或將其與已知沒有(或更少)偏差的其他程序進行比較來估計和減少偏差,估計偏差並進行補償。

用於統計推斷的術語的簡要描述並不能取代已經發布的擴展和更專業的回复。相反,它旨在作為對它們的介紹,並作為一個溫和的警告,要警惕在有限的上下文中做出的普遍概括,例如“所有三個 [術語] 都等同於‘系統性錯誤’”,這顯然是正確的只是狹義上的,因為我引用的兩個定義是不等價的。閱讀其他回复提醒我,流行病學等專業領域的文獻可能以意想不到的方式使用熟悉的標準統計術語,如“偏差”,其中一些實際上可能與統計定義相矛盾。到底,

引用自:https://stats.stackexchange.com/questions/18945

comments powered by Disqus