我如何(以數字方式)為具有大 alpha 和 beta 的 beta 分佈近似值
是否有一種數值穩定的方法來計算大整數 alpha、beta(例如 alpha、beta > 1000000)的beta 分佈值?
實際上,我只需要該模式周圍的 99% 置信區間,如果這以某種方式使問題變得更容易的話。
補充:對不起,我的問題沒有我想像的那麼清楚。我想做的是:我有一台機器可以檢查傳送帶上的產品。這些產品中的一部分被機器拒收。現在,如果機器操作員更改了某些檢查設置,我想向他/她展示估計的廢品率,並暗示當前估計的可靠性。
所以我認為我將實際拒絕率視為隨機變量 X,並根據拒絕對象 N 和接受對象 M 的數量計算該隨機變量的概率分佈。如果我假設 X 的先驗分佈均勻,這是一個取決於 N 和 M 的 beta 分佈。我可以直接向用戶顯示這個分佈,也可以找到一個區間 [l,r] 以便實際的拒絕率在這個區間內,p >= 0.99(使用 shabbychef 的術語)並顯示這個間隔。對於較小的M,N(即參數變化後立即),我可以直接計算分佈並近似區間[l,r]。但是對於較大的 M,N,這種幼稚的方法會導致下溢錯誤,因為 x^N*(1-x)^M 太小而無法表示為雙精度浮點數。
我想我最好的選擇是對小 M,N 使用我的天真 beta 分佈,並在 M,N 超過某個閾值時切換到具有相同均值和方差的正態分佈。那有意義嗎?
正態近似效果非常好,尤其是在尾部。使用平均值和方差. 例如,在艱難的情況下(可能需要關注偏度)尾部概率的絕對相對誤差,例如周圍的山峰並且小於當你的平均值超過 1 SD 時。(這不是因為 beta 太大:與,絕對相對誤差為.) 因此,這種近似對於涉及 99% 區間的任何目的基本上都是極好的。
鑑於對問題的編輯,請注意,實際上並不通過積分被積函數來計算 beta 積分:當然你會得到下溢(儘管它們並不重要,因為它們對積分沒有明顯貢獻) . 如 Johnson & Kotz(統計分佈)中所述,有很多很多方法可以計算積分或近似積分。在http://www.danielsoper.com/statcalc/calc37.aspx可以找到在線計算器。你實際上需要這個積分的倒數。一些計算逆的方法記錄在 Mathematica 站點http://functions.wolfram.com/GammaBetaErf/InverseBetaRegularized/. 代碼在數字食譜 (www.nr.com) 中提供。Wolfram Alpha 網站 (www.wolframalpha.com) 是一個非常好的在線計算器:輸入
inverse beta regularized (.005, 1000000, 1000001)
左端點和inverse beta regularized (.995, 1000000, 1000001)
右端點 (, 99% 區間)。