誰創建了第一個標準正常表？

September 4, 2016

我即將在我的介紹性統計課中介紹標準正態表，這讓我想知道：誰創建了第一個標準正態表？在計算機出現之前，他們是如何做到的？想到有人用蠻力手動計算一千個黎曼和，我不寒而栗。

拉普拉斯第一個認識到製表的必要性，提出了近似值：

$$ \begin{align}G(x)&=\int_x^\infty e^{-t^2}dt\[2ex]&=\small \frac1 x- \frac{1}{2x^3}+\frac{1\cdot3}{4x^5} -\frac{1\cdot 3\cdot5}{8x^7}+\frac{1\cdot 3\cdot 5\cdot 7}{16x^9}+\cdots\tag{1} \end{align} $$

正態分佈的第一個現代表後來由法國天文學家克里斯蒂安·克蘭普（Christian Kramp）在*天文學和地球折射分析中建立（由羅爾系中央學院化學和實驗物理學教授 Citizen Kramp 於 1799 年）*。來自與正態分佈相關的表格：簡史作者：Herbert A. David 資料來源：美國統計學家，卷。59，第 4 期（2005 年 11 月），第 4 頁。309-311：

雄心勃勃地，克蘭普給出了八進制 ( $ 8 $ D) 最多的表格 $ x = 1.24, $ $ 9 $ D到 $ 1.50, $ $ 10 $ D到 $ 1.99, $ 和 $ 11 $ D到 $ 3.00 $ 以及插值所需的差異。寫出前六個導數 $ G(x), $ 他只是使用泰勒級數展開 $ G(x + h) $ 關於 $ G(x), $ 和 $ h = .01, $ 直到任期 $ h^3. $ 這使他能夠一步一步地從 $ x = 0 $ 到 $ x = h, 2h, 3h,\dots, $ 乘法時 $ h,e^{-x^2} $ 經過$$ 1-hx+ \frac 1 3 \left(2x^2 - 1\right)h^2 - \frac 1 6 \left(2x^3 - 3x\right)h^3. $$ 因此，在 $ x = 0 $ 該產品減少到 $$ .01 \left(1 - \frac 1 3 \times .0001 \right) = .00999967, $$ 所以在 $ G(.01) = .88622692 - .00999967 = .87622725. $

$$ \vdots $$

但是……他能準確到什麼程度？好，我們來 $ 2.97 $ 舉個例子：

驚人！

讓我們繼續討論高斯 pdf 的現代（歸一化）表達式：

的pdf $ \mathscr N(0,1) $ 是：

$$ f_X(X=x)=\large \frac{1}{\sqrt{2\pi}},e^{-\frac {x^2}{2}}= \frac{1}{\sqrt{2\pi}},e^{-\left(\frac {x}{\sqrt{2}}\right)^2}= \frac{1}{\sqrt{2\pi}},e^{-\left(z\right)^2} $$

在哪裡 $ z = \frac{x}{\sqrt{2}} $ . 因此， $ x = z \times \sqrt{2} $ .

所以讓我們去 R，然後查找 $ P_Z(Z>z=2.97) $ …好吧，沒那麼快。首先我們必須記住，當指數函數中有一個常數乘以指數時 $ e^{ax} $ ，積分將除以該指數： $ 1/a $ . 由於我們的目標是複制舊表中的結果，我們實際上是在乘以 $ x $ 經過 $ \sqrt{2} $ ，它必須出現在分母中。

此外，Christian Kramp 沒有進行歸一化，因此我們必須相應地修正 R 給出的結果，乘以 $ \sqrt{2\pi} $ . 最終的修正將如下所示：

$$ \frac{\sqrt{2\pi}}{\sqrt{2}},\mathbb P(X>x)=\sqrt{\pi},,\mathbb P(X>x) $$

在上述情況下， $ z=2.97 $ 和 $ x=z\times \sqrt{2}=4.200214 $ . 現在讓我們去R：
(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.00002363235e-05
極好的！

讓我們去桌子的頂端找點樂子吧，說 $ 0.06 $ …
z = 0.06
(x = z * sqrt(2))

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.8262988
克蘭普怎麼說？ $ 0.82629882 $ .

很近…

問題是……到底有多近？在收到所有贊成票之後，我不能讓實際答案懸而未決。問題是我嘗試過的所有光學字符識別 (OCR) 應用程序都令人難以置信——如果你看過原版，這並不奇怪。因此，當我親自在他的Table Première第一欄中輸入每個數字時，我學會了欣賞 Christian Kramp 的堅韌不拔的工作。

在@Glen_b 的一些寶貴幫助之後，現在它可能非常準確，並且可以在此 GitHub 鏈接中的 R 控制台上複製和粘貼。

以下是對他計算準確性的分析。振作起來…

[R] 值與 Kramp 近似值之間的絕對累積差異：

$ 0.000001200764 $ - 在……的進程中 $ 301 $ 計算，他設法累積了大約 $ 1 $ 百萬分之一！

平均絕對誤差(MAE)mean(abs(difference))，或difference = R - kramp：

$ 0.000000003989249 $ - 他設法使一個荒謬的 $ 3 $ 平均十億分之一的錯誤！

在他的計算與 [R] 相比差異最大的條目中，第一個不同的小數位值位於第八位（百萬分之一）。平均（中位數）他的第一個“錯誤”在十進制數字中（十億分之一！）。而且，儘管他在任何情況下都沒有完全同意[R]，但最接近的條目直到十三個數字條目才出現分歧。

平均相對差或mean(abs(R - kramp)) / mean(R)（與相同all.equal(R[,2], kramp[,2], tolerance = 0)）：

$ 0.00000002380406 $

均方根誤差(RMSE)或偏差（給大錯誤更多的權重），計算如下sqrt(mean(difference^2))：

$ 0.000000007283493 $

如果您找到 Chistian Kramp 的圖片或肖像，請編輯此帖子並將其放在此處。