Normal-Distribution

均勻和分佈的正態近似誤差

  • June 14, 2012

一種近似正態分佈的簡單方法是加在一起IID 隨機變量均勻分佈在,然後依靠中心極限定理重新定位和重新縮放。(旁注:還有更精確的方法,例如Box–Muller 變換。) IID 的總和隨機變量稱為均勻和分佈或Irwin-Hall 分佈

用正態分佈逼近均勻和分佈的誤差有多大?

每當出現這種類型的問題來近似 IID 隨機變量的總和時,人們(包括我)都會提出Berry-Esseen 定理,這是中心極限定理的一個有效版本,因為存在第三個矩:

在哪裡是重新縮放總和的累積分佈函數IID 隨機變量,是絕對第三中心矩,是標準差,並且是一個絕對常數,可以認為是甚至.

這是不令人滿意的。在我看來,Berry-Esseen 估計在離散的二項式分佈上最接近尖銳,最大誤差為對於對稱二項分佈。最大的錯誤來自最大的跳躍。然而,均勻和分佈沒有跳躍。

數值測試表明,誤差比.

使用, Berry-Esseen 估計是

這對於是關於,, 和, 分別。實際最大差異為似乎是關於,, 和, 分別要小得多並且似乎下降為代替.

讓獨立同居隨機變量並考慮歸一化和

和相關的規範

在哪裡是分佈. 引理 1 ( Uspensky ): 以下界限持有。

證明。參見 JV Uspensky (1937),數學概率導論,紐約:McGraw-Hill,p。305.

這後來被 R. Sherman 改進為以下。

引理 2 ( Sherman ):以下對 Uspensky 界的改進成立。

證明:參見 R. Sherman,N 個隨機變量之和的正態近似誤差Biometrika,第一卷。58,沒有。2, 396–398。

證明是三角不等式和經典邊界在正態分佈尾部和應用於兩個分佈中每一個的特徵函數。

引用自:https://stats.stackexchange.com/questions/30468

comments powered by Disqus