Sampling

證明使用有限總體校正的合理性

  • November 22, 2014

鑑於有限總體校正有效地降低了抽樣分佈的標準誤差,這(與缺乏有限總體校正相比)將增加假設檢驗的檢驗統計量(並因此增加拒絕零值的概率),它似乎是一個非常強大的工具,無需強有力的理由即可使用。

這是我認為使用它是合理的一種情況:

[編輯 2 - 我根據史蒂夫的一個非常有效的觀點稍微改變了這裡的場景。我不希望不答复率分散對有限人口校正的關注]。

我有一家公司在過去 12 個月裡有了新的領導層。在舊領導期間,我對 50% 的員工進行了隨機抽樣(回复率為 100%)。在新的領導下,我對 45% 的員工進行了同樣的調查(同樣,回复率為 100%)

如果我想查看調查中某些問題的結果如何以統計顯著的方式發生變化,我應該應用有限總體校正。我正在比較兩個特定時間點的兩組員工。除了在這兩個時間點在公司內工作的人之外,我不關心任何人。

[編輯 2 - 澄清我的擔憂]

此外,那些在這兩個時間點不在公司工作的人無論如何都無法回答調查。像“過去幾個月我很享受在這里工作”這樣的基本問題,只有那些真正在公司工作過的人才能合理地回答。在這種情況下,假設一個無限的人口似乎對抽樣分佈施加了任意限制。

這是我認為使用它不合理的一種情況:

我對從我這裡購買產品的客戶樣本進行了問卷調查,以評估他們的興趣,以便我告訴我如何最好地在未來幾年內使我的業務多樣化。雖然這個樣本是我開業以來服務過的所有客戶的 20%,但我可以認為這裡的人口包括所有沒有從我這裡購買產品的客戶(因為他們不在該地區或我的價格太高或他們不知道我的商店等),因此我有一個人口,使我的樣本大小小於它的 1%)。

問題:

人們是否同意我對這兩個示例場景的解釋?

在製作一件作品時,包含您使用有限總體校正的理由是否是一種好習慣?

這主要是對“誰”人群的評估,以及您是否希望您的結果僅適用於“已知”人群,或者您是否正在尋求提供比“已知”人群具有更廣泛應用水平的東西?

由於您給出的原因,您對第二種情況是正確的,但對第一種情況卻不是。有限總體校正 ( fpc ) 的理論僅適用於沒有放回的隨機樣本(Lohr (2009) Sec 2.8, pp 51-530。關鍵詞是隨機的。隨機樣本的標誌是選擇由隨機決定數字或物理等價物。在您的第一個場景中,響應的 45% 的人口不是由隨機數選擇的。如果 45% 是人口的更大隨機樣本的一部分,情況也是如此:響應不受控制通過隨機數。

即使您有一個具有(接近)100% 響應的大部分人口樣本,如果您的研究目的是進行預測、估計優勢比或以其他方式檢驗假設或引用 p,您仍然應該省略 fpc -價值觀。推理很有趣(Cochran, 1977, p.39):對於有限的人口,很少有科學興趣詢問零假設(例如,兩個比例相等)是否完全正確。除非有非常罕見的機會,否則不會,因為通過枚舉整個人口會發現這一點。這導致採用“超人口”觀點,如今幾乎所有統計學家都採用這種觀點。您的第二種情況是這種情況的一種變體。另見 Deming(1966) 第 247-261 頁“枚舉和分析研究之間的區別”;Korn 和 Graubard(1999 年),p。227.

11 月 26 日添加 我應該注意到有限總體校正在這裡是一個小問題。主要問題是 55% 的不答復和隨後的不答复偏差。調查專業人士普遍同意,最好採取較小的可管理樣本,並通過個性化初始聯繫和跟進無響應者來專注於減少無響應。調查後加權修正也可能有所幫助,但會增加標準誤差。

綜上,回答你的三個問題:

  1. 您對第一種情況的解釋是不正確的。
  2. 你真的不需要說什麼。如果您的目標僅描述您從中抽取樣本的有限總體,那麼您可以提及您省略了 fpc,因為效果微乎其微。否則,當您進行假設檢驗或預測時,您可能會提到省略 fpc,但我從未見過有人這樣做。
  3. 是否使用fpc的決定是您在問題中描述的評估。所以答案是“是”。

附加討論請在此處查看相關的簡歷討論。

參考

科克倫,WG(1977)。抽樣技術(第 3 版)。紐約:威利。

戴明,我們(1966 年)。一些抽樣理論。紐約:多佛出版社。

Korn, EL 和 Graubard, BI (1999)。健康調查分析(概率和統計中的威利系列)。紐約:威利。

Levy、Paul S 和 Stanley Lemeshow。2008. 人口抽樣:方法和應用。調查方法中的威利系列。新澤西州霍博肯:威利。

Lohr, Sharon L. 2009。抽樣:設計和分析。馬薩諸塞州波士頓:Cengage Brooks/Cole。

引用自:https://stats.stackexchange.com/questions/125058

comments powered by Disqus