Binomial-Distribution

為什麼連續性校正(例如,二項分佈的正態近似)有效?

  • May 22, 2016

我希望更好地理解對正態近似的二項分佈的連續性校正是如何得出的。

使用什麼方法來決定我們應該添加 1/2(為什麼不添加另一個數字?)。任何解釋(或建議閱讀的鏈接,除此之外,不勝感激)。

  1. 事實上,它並不總是“工作”(在任何時候總是通過正態改進二項式 cdf 的近似值))。如果二項式是 0.5 我認為它總是有幫助的,除了最極端的尾巴。如果與 0.5 相差不遠,對於相當大的它通常工作得很好,除了在遠尾,但如果接近 0 或 1 它可能根本沒有幫助(見下文第 6 點)
  2. 要記住的一件事(儘管插圖幾乎總是涉及 pmfs 和 pdfs)是我們試圖近似的東西是 cdf。思考二項式的 cdf 和近似法線的情況可能很有用(例如,這裡是):

在此處輸入圖像描述

在極限中,標準化二項式的 cdf 將達到標準法線(請注意,標準化會影響 x 軸上的比例,但不會影響 y 軸);一路走來越來越大二項式 cdf 的跳躍往往更均勻地跨越正常 cdf。

讓我們放大並在上面的簡單示例中查看:

在此處輸入圖像描述

請注意,由於近似法線通過接近垂直跳躍的中間*,而在極限中,法線 cdf 局部近似線性並且(每次跳躍頂部的二項式 cdf 的進展也是如此);因此,cdf 趨向於穿過附近的水平台階. 如果要近似二項式 cdf 的值,在整數,正常的 cdf 達到該高度附近.

  • 如果我們將 Berry-Esseen 應用於均值校正的伯努利變量,則 Berry-Esseen 界限在靠近和靠近– 正常的 cdf 必須合理地接近跳躍的中間位置,否則 cdfs 的絕對差異將超過一側或另一側的最佳 Berry-Essen 約束。這反過來又關係到距離正常的 cdf 可以穿過二項式 cdf 階躍函數的水平部分。
  1. 擴展 1. 中的動機。讓我們考慮如何使用二項式 cdf 的正態近似來計算. 例如(見上面的第二張圖)。所以我們的法線具有相同的均值和標準差是. 請注意,我們將通過正常 cdf 在大約 8.5 和 9.5 之間的變化來近似 cdf 在 9 處的跳躍。

在此處輸入圖像描述

  1. 在不太正式但更“通常”的教科書動機下做同樣的事情(這可能更直觀,尤其是對於初學者來說),我們試圖用連續變量來近似離散變量。我們可以通過替換每個高度的概率峰值來製作二項式的連續版本以寬度為 1 的矩形為中心, 給它高度(見下面的藍色矩形;想像每個 x 值一個),然後用與原始二項式相同的均值和 sd 的正態密度來近似:

[在此處輸入圖像描述

框下方的面積近似為之間的法線和; 位於水平台階上方和下方的兩個幾乎三角形的部分在面積上靠得很近。一個區間中的一些二項式概率之和將減少為這些近似值的集合。(如果不能立即清楚是否需要在特定計算中上升或下降 0.5,則繪製這樣的圖表通常非常有用……找出您想要在計算中使用的二項式值,然後通過每一個人。)

可以使用推導[沿著 De Moivre 的路線-例如參見此處此處]以代數方式激發這種方法來推導正態近似(儘管它可以比 De Moivre 的方法更直接地執行)。

這基本上是通過幾個近似值進行的,包括使用斯特林的近似值術語並使用它得到那個

也就是說,具有均值的法線的密度和方差在大約是二項式 pmf 在的高度. 這基本上就是 De Moivre 的目標。

所以現在考慮我們有一個關於二項式高度的正常區域的中點規則近似……也就是說,對於, 中點規則說我們從 De Moivre 那裡得到. 翻來覆去,.

[類似的“中點規則”類型的近似值可用於通過使用連續性校正的密度來激勵其他此類連續 pmfs 近似值,但必須始終小心注意調用該近似值的地方] 5. 歷史註釋:連續性校正似乎起源於 1838 年的奧古斯都·德·摩根,作為對 De Moivre 近似值的改進。例如,參見 Hald (2007)[1]。根據 Hald 的描述,他的推理與上述第 4 項一致(即,基本上是通過用以 x 值為中心的寬度為 1 的“塊”替換概率尖峰來近似 pmf)。 6. 連續性校正無濟於事的情況說明:

在此處輸入圖像描述

在左邊的情節中(和以前一樣,是二項式,是正態近似),所以. 在右邊的圖中(相同的二項式,但在尾部更遠),所以–也就是說,忽略連續性校正比在這個區域使用它要好。

[1]: Hald, Anders (2007),

“A History of Parametric Statistical Inference from Bernoulli to Fisher, 1713-1935”,

Sources and Studies in the History of Mathematics and Physical Sciences,

Springer-Verlag New York

引用自:https://stats.stackexchange.com/questions/213966

comments powered by Disqus