Distributions

如果2個隨機變量具有完全相同的均值和方差[重複]

  • November 16, 2017

如果兩個連續隨機變量具有完全相同的期望值和方差,它們是否總是具有相同的分佈?

簡而言之:不。概率分佈有幾個屬性不需要影響它的均值和方差,但確實決定了它的形狀。

偏斜和峰度

例如,泊松分佈 $ \lambda = 1 $ 有期望值 $ \lambda = 1 $ 和方差 $ \lambda = 1 $ . 正態分佈也是如此 $ \mu = 1 $ 和 $ \sigma^2 = 1 $ .

具有兩個連續分佈的示例:採用指數分佈 $ \lambda = 1 $ , 這樣它的方差也是 $ \lambda^{-2} = \frac{1}{1^2} = 1 $ 並將其與正態分佈進行比較 $ \mu = 1 $ 和 $ \sigma^2 = 1 $ . 這些具有相同的期望值和相同的方差,但看起來完全不同,並且會產生非常不同的數字:

偏斜和峰度改變分佈而不影響均值或方差。

至於與這些均值和方差相等的分佈有何不同:考慮分佈的偏斜和過度峰度。這些都是 $ 0 $ 適用於正態分佈,但不適用於指數分佈。

多式聯運

正如@Glen_b 指出的那樣,偏斜和峰度並不是唯一需要考慮的事情。另一個例子是多模態:具有多個模態的連續分佈可以具有與具有單個模態的分佈相同的均值和方差,但顯然它們不是同分佈的。

例如,考慮兩個正態分佈的混合,每個正態分佈 $ \sigma^2 = 1 $ ,但他們的手段是 $ 2 $ 和 $ -2 $ , 分別。所得混合物的平均值為 $ \mu=0 $ 和方差 $ \sigma^2 = 5 $ ,與單個正態分佈具有相同的期望和方差 $ \mathcal{N}(0, 5) $ :

影響形狀的多模態,但不影響均值或方差。

如果你想自己嘗試,這在 R 中很容易演示:

n <- 10e6             # some arbitrarily large sample size
y1 <- rnorm(n, -2, 1) # mixture component 1
y2 <- rnorm(n, 2, 1)  # mixture component 2
y.mixture <- c(y1, y2)
mean(y.mixture)
var(y.mixture)

相對:

y.single <- rnorm(10e6, 0, sqrt(5)) # R parameterizes with sd instead of var
mean(y.single)
var(y.single)

引用自:https://stats.stackexchange.com/questions/314000

comments powered by Disqus