Estimation

為什麼聲稱樣本通常比人口普查更準確?

  • January 20, 2012

在學習採樣的過程中,我遇到以下兩種說法:

1)抽樣誤差主要導致可變性,非抽樣誤差導致偏差。

2)由於非抽樣誤差,樣本通常比人口普查更準確。

我不知道如何理解這兩種說法。獲取這兩個語句的基本邏輯是什麼?

如果這項工作是人口普查的事實增加了非抽樣誤差的偏差,那麼樣本可能比(嘗試的)人口普查更準確。例如,如果人口普查引發了一場提倡不答复的不利政治運動(樣本不太可能發生這種情況),這可能會發生。除非發生這種情況,否則我看不出為什麼樣本的非抽樣誤差比人口普查要少;根據定義,它會有更多的抽樣誤差。因此,除了非常不尋常的情況外,我會說人口普查將比樣本更準確。

考慮一個常見的非抽樣誤差來源——系統性的不響應,例如特定社會人口群體。如果來自 X 組的人可能會拒絕人口普查,那麼他們同樣可能會拒絕樣本。即使使用後分層抽樣來加權 X 組中您說服回答您的問題的人回答,您仍然會遇到問題,因為這些可能正是 X 中支持調查的部分。除了盡可能小心地設計儀器和交付方法之外,沒有真正的方法可以解決這個問題。

順便說一句,這確實引起了人們對一個可能使嘗試的人口普查不如樣本準確的問題的關注。樣本通常對人口具有後分層權重,這減輕了諸如我上面段落中的問題的偏見問題。未獲得 100% 回報的嘗試性普查只是一個大樣本,原則上應進行同樣的處理;但由於它被視為“人口普查”(而不是試圖進行的人口普查),因此可能會被忽略。因此,人口普查可能不如適當加權的樣本準確。但在這種情況下,問題在於分析處理技術(或遺漏),而不是試圖進行人口普查的內在因素。

效率是另一回事——正如米歇爾所說,一個執行良好的樣本將比人口普查更有效率,而且它很可能具有足夠的準確性用於實際目的。

引用自:https://stats.stackexchange.com/questions/21403

comments powered by Disqus