Normal-Distribution

誰創建了第一個標準正常表?

  • September 4, 2016

我即將在我的介紹性統計課中介紹標準正態表,這讓我想知道:誰創建了第一個標準正態表?在計算機出現之前,他們是如何做到的?想到有人用蠻力手動計算一千個黎曼和,我不寒而栗。

拉普拉斯第一個認識到製表的必要性,提出了近似值:

$$ \begin{align}G(x)&=\int_x^\infty e^{-t^2}dt\[2ex]&=\small \frac1 x- \frac{1}{2x^3}+\frac{1\cdot3}{4x^5} -\frac{1\cdot 3\cdot5}{8x^7}+\frac{1\cdot 3\cdot 5\cdot 7}{16x^9}+\cdots\tag{1} \end{align} $$

正態分佈的第一個現代表後來由法國天文學家克里斯蒂安·克蘭普(Christian Kramp)在*天文學和地球折射分析中建立(由羅爾系中央學院化學和實驗物理學教授 Citizen Kramp 於 1799 年)*。來自與正態分佈相關的表格:簡史作者:Herbert A. David 資料來源:美國統計學家,卷。59,第 4 期(2005 年 11 月),第 4 頁。309-311

雄心勃勃地,克蘭普給出了八進制 ( $ 8 $ D) 最多的表格 $ x = 1.24, $ $ 9 $ D到 $ 1.50, $ $ 10 $ D到 $ 1.99, $ 和 $ 11 $ D到 $ 3.00 $ 以及插值所需的差異。寫出前六個導數 $ G(x), $ 他只是使用泰勒級數展開 $ G(x + h) $ 關於 $ G(x), $ 和 $ h = .01, $ 直到任期 $ h^3. $ 這使他能夠一步一步地從 $ x = 0 $ 到 $ x = h, 2h, 3h,\dots, $ 乘法時 $ h,e^{-x^2} $ 經過$$ 1-hx+ \frac 1 3 \left(2x^2 - 1\right)h^2 - \frac 1 6 \left(2x^3 - 3x\right)h^3. $$ 因此,在 $ x = 0 $ 該產品減少到 $$ .01 \left(1 - \frac 1 3 \times .0001 \right) = .00999967, $$ 所以在 $ G(.01) = .88622692 - .00999967 = .87622725. $


在此處輸入圖像描述

在此處輸入圖像描述

$$ \vdots $$

在此處輸入圖像描述

但是……他能準確到什麼程度?好,我們來 $ 2.97 $ 舉個例子:

在此處輸入圖像描述

驚人!

讓我們繼續討論高斯 pdf 的現代(歸一化)表達式:

的pdf $ \mathscr N(0,1) $ 是:

$$ f_X(X=x)=\large \frac{1}{\sqrt{2\pi}},e^{-\frac {x^2}{2}}= \frac{1}{\sqrt{2\pi}},e^{-\left(\frac {x}{\sqrt{2}}\right)^2}= \frac{1}{\sqrt{2\pi}},e^{-\left(z\right)^2} $$

在哪裡 $ z = \frac{x}{\sqrt{2}} $ . 因此, $ x = z \times \sqrt{2} $ .

所以讓我們去 R,然後查找 $ P_Z(Z>z=2.97) $ …好吧,沒那麼快。首先我們必須記住,當指數函數中有一個常數乘以指數時 $ e^{ax} $ ,積分將除以該指數: $ 1/a $ . 由於我們的目標是複制舊表中的結果,我們實際上是在乘以 $ x $ 經過 $ \sqrt{2} $ ,它必須出現在分母中。

此外,Christian Kramp 沒有進行歸一化,因此我們必須相應地修正 R 給出的結果,乘以 $ \sqrt{2\pi} $ . 最終的修正將如下所示:

$$ \frac{\sqrt{2\pi}}{\sqrt{2}},\mathbb P(X>x)=\sqrt{\pi},,\mathbb P(X>x) $$

在上述情況下, $ z=2.97 $ 和 $ x=z\times \sqrt{2}=4.200214 $ . 現在讓我們去R:

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.00002363235e-05

極好的!

讓我們去桌子的頂端找點樂子吧,說 $ 0.06 $ …

z = 0.06
(x = z * sqrt(2))

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.8262988

克蘭普怎麼說? $ 0.82629882 $ .

很近…


問題是……到底有多近?在收到所有贊成票之後,我不能讓實際答案懸而未決。問題是我嘗試過的所有光學字符識別 (OCR) 應用程序都令人難以置信——如果你看過原版,這並不奇怪。因此,當我親自在他的Table Première第一欄中輸入每個數字時,我學會了欣賞 Christian Kramp 的堅韌不拔的工作。

在@Glen_b 的一些寶貴幫助之後,現在它可能非常準確,並且可以在此 GitHub 鏈接中的 R 控制台上複製和粘貼。

以下是對他計算準確性的分析。振作起來…

  1. [R] 值與 Kramp 近似值之間的絕對累積差異:

$ 0.000001200764 $ - 在……的進程中 $ 301 $ 計算,他設法累積了大約 $ 1 $ 百萬分之一!

  1. 平均絕對誤差(MAE)mean(abs(difference)),或difference = R - kramp

$ 0.000000003989249 $ - 他設法使一個荒謬的 $ 3 $ 平均十億分之一的錯誤!

在他的計算與 [R] 相比差異最大的條目中,第一個不同的小數位值位於第八位(百萬分之一)。平均(中位數)他的第一個“錯誤”在十進制數字中(十億分之一!)。而且,儘管他在任何情況下都沒有完全同意[R],但最接近的條目直到十三個數字條目才出現分歧。

  1. 平均相對差mean(abs(R - kramp)) / mean(R)(與 相同all.equal(R[,2], kramp[,2], tolerance = 0)):

$ 0.00000002380406 $

  1. 均方根誤差(RMSE)或偏差(給大錯誤更多的權重),計算如下sqrt(mean(difference^2))

$ 0.000000007283493 $


如果您找到 Chistian Kramp 的圖片或肖像,請編輯此帖子並將其放在此處。

引用自:https://stats.stackexchange.com/questions/233356

comments powered by Disqus