Mathematical-Statistics

隨機變量和隨機樣本有什麼區別?

  • October 11, 2016

在我學習統計學的時候,這兩個表達式讓我很困惑。在我看來,它們是完全不同的東西。

隨機樣本是從總體中隨機抽取一個樣本,而隨機變量就像一個函數,它將實驗的所有可能結果的集合映射到一個實數。

但是,假設我抽取一些樣本,,和, 在哪裡和是未知的,是,,隨機樣本還是隨機變量?

一個隨機變量, $ X:\Omega \rightarrow \mathbb R $ , 是從樣本空間到實線的函數。這是一個確定性公式,可以像在擲骰子的隨機實驗中記下骰子落在的數字一樣簡單。實驗是隨機的,我們無法控制許多決定其結果的物理因素;然而,一旦骰子落地,隨機變量就會將物理世界中的結果映射到一個數字。

其他示例包括測量 8 個年級學生樣本的身高,或許可以推斷總體參數(包括均值和方差)。每個男孩或女孩都是隨機實驗的結果,就像扔硬幣一樣。一旦選擇了一個主題,實際映射到以英寸或厘米為單位的數字就不會受到隨機性的影響,儘管它的名稱是“隨機變量”。

一組這樣的實驗將構成一個樣本:“在統計學中,簡單的隨機樣本是從更大的集合(總體)中選擇的個體(樣本)的子集。” 這個定義很直觀,但隱含了人口這一術語。本文試圖彌補這一差距,指出“人口”一詞作為名詞應該指的是樣本空間,而不是許多教科書中的隨機變量。”

隨機樣本是一組 $ n $ 獨立同分佈(iid)隨機變量 $ X_1, X_2, X_3,\dots, X_n. $ 其中 $ {\displaystyle X_{i}} $ 是函數 $ X(\cdot) $ 應用於結果 $ i $ -第實驗: $ {\displaystyle x_{i}=X_{i}(\omega )}. $ 儘管無放回抽樣不滿足獨立性要求,但在從大量人口中抽樣時忽略了這一點,以利於計算方便。

這 $ n $ -元組 $ x_1,x_2,x_3,\dots,x_n $ 是隨機變量的特定實現,在問題中提出的情況下,將來自 $ N(\mu,\sigma^2) $ 同分佈 $ X_i $ 隨機變量。因此,在 OP 中,“抽取一些樣本”的過程將導致這個隨機變量集合的單獨實現。

隨機變量是數學定律的對象,例如 LLN 或 CLT。隨機變量的分佈將決定從隨機樣本中進行歸納的可行性。例如,任何給定的實現總是有一個平均值和一個標準差作為 $ n $ -元組或實數,但它們生成的隨機變量可能沒有有限矩,例如帕累托,這會損害對總體特徵的統計推斷。

引用自:https://stats.stackexchange.com/questions/239500

comments powered by Disqus