方差的反函數
對於給定的常數(例如4),是否有可能找到一個概率分佈,所以我們有?
仔細考慮案例: 如果 那麼分佈是退化的,但是 可能有任何意義。那是,和對於任何. 所以我們可以找到許多可能的分佈, 但它們被索引並完全指定為,.
如果,找不到分佈,因為.
為了,答案將取決於已知的附加信息. 例如,如果已知有均值,那麼對於任何和我們可以通過以下方式找到這些時刻的分佈. 這不是匹配均值和方差問題的唯一解決方案,但它是唯一的正態分佈解決方案(在所有可能的解決方案中,這是使熵最大化的解決方案,正如 Daniel 指出的那樣)。如果您還想匹配例如第三個中心矩或更高,那麼您將需要考慮更廣泛的概率分佈。
假設我們有一些關於分佈的信息而不是它的時刻。例如,如果我們知道遵循泊松分佈,那麼唯一的解決方案是. 如果我們知道服從指數分佈,然後又存在唯一解, 我們通過求解找到了參數.
在其他情況下,我們可以找到一整套解決方案。如果我們知道遵循矩形(連續均勻)分佈,那麼我們可以找到一個唯一的寬度通過求解分佈. 但是會有一整套解決方案,參數化——這個集合中的分佈都是彼此的翻譯。同樣,如果是正態的,那麼任何分佈 會工作(所以我們有一整套解決方案的索引,它又可以是任何實數,而且家庭都是彼此的翻譯)。如果遵循伽馬分佈,然後使用形狀尺度參數化,我們可以獲得一整套解決方案,參數化. 這個家庭的成員不是彼此的翻譯。為了幫助可視化“解決方案系列”的外觀,這裡有一些正態分佈的示例,索引為, 然後是 gamma 分佈索引為,均方差等於四,對應示例在你的問題中。
另一方面,對於某些分佈,可能會或可能不會找到解決方案,具體取決於. 例如,如果必須是伯努利變量,那麼對於有兩種可能的解決方案因為有兩個概率求解方程,實際上這兩個概率是互補的,即. 為了只有唯一的解決方案,並且對於沒有伯努利分佈具有足夠高的方差。
我覺得我也應該提一下這個案子. 這種情況也有解決方案,例如學生的具有兩個自由度的分佈。
繪圖的 R 代碼
require(ggplot2) x.df <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5), mu = rep(c(-4, -2, 0, 2, 4), each=100)) x.df$pdf <- dnorm(mean=x.df$mu, x.df$x) ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") + theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4") x.df <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5), theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000)) x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta) ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") + theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") + coord_cartesian(ylim = c(0, 1))