SurveyMonkey 是否忽略了您獲得非隨機樣本的事實?
SurveyMonkey 有步驟和圖表供您根據人口規模確定給定誤差範圍或置信區間所需的樣本量。
這張圖表是否只是忽略了這樣一個事實,即您不會獲得隨機樣本,因為您只會得到那些費心回應調查的人?
當我輸入這個問題時,我收到了警告,這個問題看起來很主觀,所以也許我沒有正確地問它。這實際上與 SurveyMonkey 無關,而是一個更普遍的問題——您是否可以使用我不知道的一些先進技術從自願響應數據中計算置信區間?
在出口民意調查或全國調查中,顯然他們必須處理這個問題。我的教育沒有深入涵蓋調查抽樣技術,但我認為它涉及收集人口統計數據並使用它來了解您所擁有的樣本的代表性。
但除此之外,對於一個簡單的在線調查,他們是否只是假設願意回答的人是人口的隨機樣本?
簡短的回答是肯定的:Survey Monkey 完全忽略了您獲取樣本的方式。Survey Monkey 不夠聰明,無法假設您收集的內容不是便利樣本,但幾乎每個 Survey Monkey 調查都是便利樣本。這會在您估計的內容中產生巨大的差異,任何數量的純粹抽樣都無法/將消除。一方面,您可以定義從 SRS 獲得的總體(以及其中的關聯)。另一方面,您可以定義由非隨機抽樣定義的總體,您可以在其中的關聯估計(並且功率規則適用於這些值)。作為研究人員,您可以討論差異並讓讀者確切地確定非隨機樣本在逼近真實趨勢時的有效性。
作為一點,偏見一詞的使用不一致。在概率論中,估計量的偏差定義為. 然而,估計量可能有偏差,但保持一致,因此偏差在大樣本中“消失”,例如正態分佈 RV 標準偏差的最大似然估計的偏差。IE. 沒有消失偏差的估計量,(例如)在概率論中被稱為*不一致。*研究設計專家(如流行病學家)養成了將不一致稱為“偏見”的壞習慣。在這種情況下,它是選擇偏差或志願者偏差。這當然是一種偏見,但不一致意味著再多的抽樣都無法糾正這個問題。
為了從方便的樣本數據中估計總體水平關聯,您必須正確識別抽樣概率機制並在所有估計中使用逆概率加權。在非常罕見的情況下,這有意義。在實踐中識別這種機制幾乎是不可能的。可以完成的時間是在一組具有先前信息的個人中,他們被聯繫填寫調查。可以根據先前的信息(例如年齡、性別、SES、… 人口普查是此類分析中涉及逆概率加權的一個很好的例子。