Binomial-Distribution
直觀地理解為什麼泊松分佈是二項分佈的極限情況
在 DS Sivia 的“數據分析”中,從二項分佈推導出泊松分佈。
他們認為泊松分佈是二項分佈的極限情況,當, 在哪裡是試驗次數。
問題 1:如何直觀地理解該論點?
問題2:為什麼大-限制等於, 在哪裡是成功的次數試驗?(此步驟用於推導。)
我將嘗試一個簡單直觀的解釋。記錄二項式隨機變量我們的期望是和方差是. 現在想想記錄了非常多的事件數量試驗,每個試驗的概率都非常小, 這樣我們就非常接近(真的)。然後我們有說,和, 所以均值和方差都等於. 然後請記住,對於泊松分佈的隨機變量,我們總是使均值和方差相等!這至少是泊松近似的合理性論證,但不是證明。
那就換個角度看吧,泊松點過程https://en.wikipedia.org/wiki/Poisson_point_process 上的真線。如果隨機點按照規則出現,這是我們得到的線上隨機點的分佈:
- 不相交區間中的點是獨立的
- 在很短的區間內隨機點的概率與區間的長度成正比
- 在很短的時間間隔內出現兩個或多個點的概率基本上為零。
那麼給定區間(不一定短)的點數分佈是泊松(帶參數與長度成正比)。現在,如果我們將這個區間劃分為非常多、同樣非常短的子區間(),給定子區間中兩個或多個點的概率基本上為零,因此該數字將具有非常好的近似值,即伯諾利分佈,即,所以所有這些的總和將是,因此很好地近似了該(長)區間中點數的泊松分佈。
來自@Ytsen de Boer (OP) 的編輯:@Łukasz Grad 滿意地回答了第 2 個問題。