隨機變量和隨機樣本有什麼區別?
在我學習統計學的時候,這兩個表達式讓我很困惑。在我看來,它們是完全不同的東西。
隨機樣本是從總體中隨機抽取一個樣本,而隨機變量就像一個函數,它將實驗的所有可能結果的集合映射到一個實數。
但是,假設我抽取一些樣本,,和, 在哪裡和是未知的,是,,隨機樣本還是隨機變量?
一個隨機變量, X:Ω→R , 是從樣本空間到實線的函數。這是一個確定性公式,可以像在擲骰子的隨機實驗中記下骰子落在的數字一樣簡單。實驗是隨機的,我們無法控制許多決定其結果的物理因素;然而,一旦骰子落地,隨機變量就會將物理世界中的結果映射到一個數字。
其他示例包括測量 8 個年級學生樣本的身高,或許可以推斷總體參數(包括均值和方差)。每個男孩或女孩都是隨機實驗的結果,就像扔硬幣一樣。一旦選擇了一個主題,實際映射到以英寸或厘米為單位的數字就不會受到隨機性的影響,儘管它的名稱是“隨機變量”。
一組這樣的實驗將構成一個樣本:“在統計學中,簡單的隨機樣本是從更大的集合(總體)中選擇的個體(樣本)的子集。” 這個定義很直觀,但隱含了人口這一術語。本文試圖彌補這一差距,指出“人口”一詞作為名詞應該指的是樣本空間,而不是許多教科書中的隨機變量。”
隨機樣本是一組 n 獨立同分佈(iid)隨機變量 X1,X2,X3,…,Xn. 其中 Xi 是函數 X(⋅) 應用於結果 i -第實驗: xi=Xi(ω). 儘管無放回抽樣不滿足獨立性要求,但在從大量人口中抽樣時忽略了這一點,以利於計算方便。
這 n -元組 x1,x2,x3,…,xn 是隨機變量的特定實現,在問題中提出的情況下,將來自 N(μ,σ2) 同分佈 Xi 隨機變量。因此,在 OP 中,“抽取一些樣本”的過程將導致這個隨機變量集合的單獨實現。
隨機變量是數學定律的對象,例如 LLN 或 CLT。隨機變量的分佈將決定從隨機樣本中進行歸納的可行性。例如,任何給定的實現總是有一個平均值和一個標準差作為 n -元組或實數,但它們生成的隨機變量可能沒有有限矩,例如帕累托,這會損害對總體特徵的統計推斷。