Poisson-Distribution
泊松分佈對現實中事件分佈的代表性有多大?
我一直想知道泊松分佈與我們在現實中觀察到的事件的“擬合”有多好。我幾乎總是看到它被用於模擬事件的發生。(例如,汽車到達停車場或網絡上的計算機主機發送/接收的數量或消息等)
我們通常通過泊松分佈對此類事件進行建模。分佈只是對現實情況的初步近似嗎?如果我觀察上述兩個示例中的汽車/天或消息/天的數量以及通過“從分佈中挑選”輸出的那些,它們有多大不同?泊鬆的近似值有多好?(它是一個近似值嗎?)泊松背後的“魔力”是什麼,它只是讓它正確(直觀地說:)?
我可以說的一個例子是消費品(CPG)的超市銷售。這些也是計數事件 - 超市可能每天銷售 0 個單位,或者 1 個,或者 2 個等等,所以泊松分佈似乎是一個很好的第一次擬合。
但是,@PeterEllis 的基本二項式分佈並不成立。是的,我們可以用二項式對客戶數量進行建模……但有些客戶會購買 1 個單位,有些會購買 2 個單位,有些會加載他們的食品室併購買 10 個單位。
結果通常會過度分散,因此負二項分佈比泊松分佈更適合。(有時,我們甚至可能會看到牛奶等快速移動的物品分散不足)。