Sampling
“代表性樣本”究竟指的是什麼?
閱讀以下段落時:
基於最近 88 次突襲的代表性樣本,我們表明,圖爾卡納人在大規模的戰鬥中維持了代價高昂的合作,至少部分是通過懲罰搭便車者。
我想知道“代表性樣本”可能指的是什麼。
它是否與統計推斷中的功率計算(例如)有關,或者是否有某種方法可以評估總人口中需要的樣本數量才能被認為具有代表性?
具有代表性的樣本是從感興趣的人群中無偏見地抽取的樣本。
例如,假設我想知道有多少人在早餐時喝牛奶。如果我是素食主義者,並且我隨機詢問我的朋友和同事(其中許多人也是素食主義者),那麼我抽取的樣本不能代表整個人群:我當然會發現低早餐喝牛奶的人比例,但這是我選擇的神器樣本,並不是因為現實中做的人那麼少。
基本上,如果有任何因素導致我們以非隨機方式選擇樣本,那麼推論是有問題的。在上面的示例中,代表性樣本是從所有襲擊中隨機抽取的樣本。我們也可以只在冬天抽取樣本,在這種情況下,我們可能會得到一個偏差的結果(也許寒冷使人們不太容易合作)。
希望能把事情弄清楚一點……