Binomial-Distribution

二項分佈和 Beta 分佈之間的關係

  • November 18, 2010

我更像是一個程序員而不是統計學家,所以我希望這個問題不要太天真。

它發生在隨機時間的採樣程序執行中。如果我對程序狀態進行 N=10 個隨機時間樣本,我可以看到函數 Foo 正在執行,例如,這些樣本中的 I=3 個。我對它告訴我 Foo 執行的實際時間分數 F 感興趣。

我知道我是二項式分佈的,平均 F*N。我也知道,給定 I 和 N,F 遵循 beta 分佈。事實上我已經通過程序驗證了這兩個分佈之間的關係,即

cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1

問題是我對這種關係沒有直觀的感覺。我無法“描繪”它為什麼起作用。

編輯:所有答案都具有挑戰性,尤其是@whuber’s,我仍然需要了解,但引入訂單統計數據非常有幫助。儘管如此,我意識到我應該問一個更基本的問題:給定 I 和 N,F 的分佈是什麼?每個人都指出它是 Beta,我知道。我終於從 Wikipedia ( Conjugate prior ) 中發現它似乎是Beta(I+1, N-I+1)。在用程序探索它之後,它似乎是正確的答案。所以,我想知道我是否錯了。而且,我仍然對上面顯示的兩個 cdf 之間的關係感到困惑,為什麼它們總和為 1,以及它們是否與我真正想知道的有任何關係。

考慮訂單統計的獨立從均勻分佈中抽取。因為訂單統計具有 Beta 分佈,所以不超過由 Beta 積分給出

(為什麼會這樣?這是一個不嚴謹但令人難忘的演示。介於和是機會統一的價值觀,他們中間和, 其中至少有一個介於和, 餘數介於和. 在無窮小的一階我們只需要考慮只有一個值的情況(即,本身)位於和因此值超過. 因為所有值都是獨立且一致的,所以這個概率與. 首先訂購這等於,正是 Beta 分佈的被積函數。術語可以直接從此參數計算為多項式係數或間接導出為積分的歸一化常數。)

根據定義,事件那是值不超過. 等效地,至少 的值不超過:這個簡單的(我希望是顯而易見的)斷言提供了您所尋求的直覺。等價陳述的概率由二項分佈給出,

綜上所述,Beta積分將一個事件的計算分解為一系列計算:找到至少範圍內的值,我們通常會用二項式 cdf 計算其概率,它被分解為相互排斥的情況,其中 值在範圍內並且 1 個值在範圍內盡一切可能,, 和是無窮小的長度。總結所有這樣的“窗口”——也就是說,積分——必須給出與二項式 cdf 相同的概率。

替代文字

引用自:https://stats.stackexchange.com/questions/4659

comments powered by Disqus