Sampling

“隨機樣本”和“iid 隨機變量”是同義詞嗎?

  • May 18, 2014

我一直很難理解“隨機樣本”和“iid 隨機變量”的含義。我試圖從幾個來源中找出含義,但變得越來越困惑。我在這裡發布我嘗試並了解的內容:

Degroot 的概率與統計 說:

隨機樣本/iid/樣本大小:考慮實線上的給定概率分佈,可以用 pf 或 pdf 表示. 據說隨機變量如果這些隨機變量是獨立的並且每個變量的邊際 pf 或 pdf 為. 這樣的隨機變量也被稱為獨立同分佈的,縮寫為 iid 我們將隨機變量的個數 n 稱為樣本量。

但是我讀過的另一本統計書說:

在隨機抽樣中,我們保證人口中的每個單獨單位都有平等的機會(概率)被選中。

所以,我有一種感覺,iids是構造隨機樣本的元素,而隨機樣本的過程就是隨機抽樣。我對嗎?

PS:我對這個話題很困惑,所以我會感謝詳細的回复。謝謝。

你沒有說另一本統計書是什麼,但我猜它是一本關於有限人口抽樣的書(或章節) 。

當您對隨機變量進行抽樣時,即當您考慮一個集合時 的隨機變量,你知道如果它們是獨立的,, 並且同分佈, 特別是和對所有人, 然後:

在哪裡是第二個中心時刻。 對有限總體進行抽樣有些不同。如果人口規模, 在沒有放回的抽樣中有可能的樣本大小的它們是等概率的:

例如,如果和,樣本空間為 可能的樣本是:

如果你計算每個人的出現次數,你可以看到他們是六個,即每個人都有相同的被選中的機會(6/10)。所以每個是根據第二個定義的隨機樣本。粗略地說,它不是一個獨立同分佈的隨機樣本,因為個體不是隨機變量:你可以一致地估計通過樣本均值,但永遠不會知道其確切值,但您可以知道確切的總體均值,如果(讓我重複一遍:大致。) 讓是一些人口平均數(平均身高,平均收入,…)。什麼時候 你可以估計就像在隨機變量抽樣中一樣:

但樣本均值方差不同:

在哪裡是總體準方差: . 因素通常稱為“有限種群校正因子”。 這是一個快速示例,說明(隨機變量)iid 隨機樣本和(有限總體)隨機樣本可能有何不同。統計推斷主要是關於隨機變量抽樣,抽樣理論是關於有限總體抽樣。


假設您正在製造燈泡並希望知道它們的平均壽命。你的“人口”只是理論上的或虛擬的,至少如果你繼續製造燈泡的話。所以你必須對數據生成過程進行建模並將一組燈泡解釋為(隨機變量)樣本。現在假設您找到一盒 1000 個燈泡並希望知道它們的平均壽命。您可以選擇一小組燈泡(有限的總體樣本),但您可以選擇所有燈泡。如果您選擇一個小樣本,這不會將燈泡轉換為隨機變量:隨機變量是由您生成的,因為“全部”和“一小部分”之間的選擇取決於您。然而,當一個有限的人口非常大(比如你的國家人口)時,當選擇“全部”不可行時,第二種情況最好作為第一種情況處理。

引用自:https://stats.stackexchange.com/questions/99126

comments powered by Disqus