Poisson-Distribution

泊松隨機變量的四捨五入平均值的分佈是什麼?

  • August 24, 2012

如果我有隨機變量是泊松分佈的參數, 什麼是分佈(即平均值的整數下限)?

泊鬆的總和也是泊松,但我對統計數據沒有足夠的信心來確定上述情況是否相同。

問題的一般化要求分佈當分佈在自然數上是已知和支持的。(在問題中,具有參數的泊松分佈和.)

的分佈很容易由分佈確定, 其概率生成函數 (pgf) 可以根據 pgf 來確定. 這是推導的概述。


寫對於 pgf, 其中(根據定義). 由以這樣的方式,它的 pgf,, 是

因為這絕對收斂於,我們可以將這些項重新排列為以下形式的總和

為了. 函數的冪級數由每個系列的術語從: 這有時被稱為抽取. 谷歌搜索目前沒有找到太多關於抽取的有用信息,所以為了完整起見,這裡是一個公式的推導。

讓是任何原始的團結的根源;例如,採取. 然後它遵循從和那

要看到這一點,請注意運算符是線性的,所以在基礎上檢查公式就足夠了. 將右側應用於給

什麼時候和相差幾倍,總和中的每一項等於我們得到. 否則,這些術語會循環通過這些總和為零。因此,該運算符保留了所有的權力符合模數並殺死所有其他人:這正是所需的投影。

一個公式通過更改求和的順序並將其中一個和識別為幾何求和,從而將其寫成封閉形式,很容易遵循:

例如,參數的泊松分佈的 pgf是. 和,和 pgf將會

這種方法的一種用途是計算和. 的價值pgf 的導數在是個階乘矩。這矩是第一個的線性組合階乘時刻。使用這些觀察,我們發現,例如,對於泊松分佈,其均值(即第一階乘矩)等於, 的平均值等於, 和的平均值等於:

方法

手段分別以藍色、紅色和黃色顯示,作為: 漸近地,均值下降與原始泊松均值相比。

可以獲得類似的方差公式。(他們變得凌亂,因為上升等被省略。他們明確確立的一件事是,當沒有倍數是泊松:它不具有均值和方差相等的特徵)這是作為函數的方差圖為了:

差異

有趣的是,對於較大的值方差增加。直觀地說,這是由於兩個相互競爭的現象:底函數有效地將原本不同的值組分箱;這必須導致方差*減小。*同時,正如我們所見,均值也在發生變化(因為每個 bin 都由其最小值表示);這必須導致一個等於均值差平方的項被加回。大的方差增加值越大,越大.

方差的行為和非常複雜。讓我們以一個快速模擬結束(在 中R),展示它可以做什麼。這些圖顯示了方差之間的差異和方差對於泊松分佈具有不同的值範圍從通過. 在所有情況下,這些圖似乎都達到了右側的漸近值。

set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
 x <- rpois(20000, lambda)
 v <- sapply(1:floor(lambda + 4*sqrt(lambda)), 
             function(m) var(floor(x/m)*m) - var(x))
 plot(v, type="l", xlab="", ylab="Increased variance", 
      main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})

情節

引用自:https://stats.stackexchange.com/questions/35042

comments powered by Disqus