Standard-Deviation

總體和样本有什麼區別?

  • July 20, 2010

總體和样本有什麼區別?每個變量和統計數據都使用了哪些常見變量和統計數據,它們之間如何相互關聯?

總體是研究中實體的集合。例如,男性的平均身高。這是一個假設的人口,因為它包括所有曾經生活過、現在還活著和將來會生活的人。我喜歡這個例子,因為它讓我們明白了,作為分析師,我們選擇了我們希望研究的人群。通常不可能調查/測量整個人口,因為並非所有成員都是可觀察的(例如,將來會存在的男性)。如果可以枚舉整個人口,那麼這樣做通常成本高昂並且需要大量時間。在上面的例子中,我們有一個人口“男人”和一個感興趣的參數,他們的身高。

取而代之的是,我們可以取這個群體的一個子集,稱為樣本,並在某些條件下使用這個樣本來推斷研究中的群體。因此,我們可以測量人口樣本中男性的平均身高,我們稱之為統計數據,並使用它來推斷人口中感興趣的參數。這是一個推論,因為根據樣本得出關於總體的結論會涉及一些不確定性和不准確性。這應該是顯而易見的——我們樣本中的成員比我們的人口少,因此我們丟失了一些信息。

選擇樣本的方法有很多種,對此的研究稱為抽樣理論。一種常用的方法稱為簡單隨機抽樣 (SRS)。在 SRS 中,總體中的每個成員都有相同的概率被包含在樣本中,因此稱為“隨機”。還有許多其他的抽樣方法,例如分層抽樣、整群抽樣等,它們各有優缺點。

重要的是要記住,我們從總體中抽取的樣本只是大量潛在樣本中的一個。如果十位研究人員都在研究同一個人群,抽取他們自己的樣本,那麼他們可能會得到不同的答案。回到我們之前的例子,十位研究人員中的每一個都可能會得出不同的男性平均身高,即所討論的統計數據(平均身高)因樣本而異——它具有稱為抽樣分佈的分佈。我們可以使用這個分佈來理解我們對總體參數估計的不確定性。

已知樣本均值的抽樣分佈是標準偏差等於樣本標準偏差除以樣本大小的正態分佈。因為這很容易與樣本的標準偏差相混淆,所以更常見的是將抽樣分佈的標準偏差稱為標準誤差

引用自:https://stats.stackexchange.com/questions/269

comments powered by Disqus