Normal-Distribution

來自正常樣本的最小階統計的期望值

  • November 26, 2013

2014 年 1 月 25 日更新: 該錯誤現已更正。請忽略上傳圖片中預期值的計算值 - 它們是錯誤的 - 我不會刪除圖片,因為它已經生成了這個問題的答案。

2014 年 1 月 10 日更新: 發現錯誤 - 使用的一個來源中的數學錯字。正在準備修正…

來自集合的最小階統計的密度具有 cdf 的 iid 連續隨機變量和pdf是

如果這些隨機變量是標準正態的,那麼

所以它的期望值為

我們使用了標準法線的對稱屬性。在Owen 1980 , p.402, eq.[ n,011 ] 我們發現

eq之間的匹配參數和(,) 我們獲得

再次在歐文 1980 年,第 3 頁。409, eq [ n0,010.2 ] 我們發現

在哪裡是標準多元正態分佈,是成對相關係數和.

匹配和我們有,,, 和

使用這些結果,eq變成

這個等相關變量的多元標準正態概率積分,所有評估為零,已經進行了足夠的研究,並且已經導出了各種近似和計算它的方法。Gupta (1963)是一篇廣泛的評論(一般與多元正態概率積分的計算有關) 。Gupta 為各種相關係數和多達 12 個變量提供顯式值(因此它涵蓋了 14 個變量的集合)。結果是**(最後一列錯誤)**:

在此處輸入圖像描述

現在,如果我們繪製圖表的值變化與,我們會得到

在此處輸入圖像描述

所以我得出了我的三個問題/要求:

1)有人可以通過分析檢查和/或通過模擬驗證預期值的結果是否正確(即檢查 eq 的有效性)?

2)假設該方法是正確的,有人可以為具有非零均值和非單一方差的法線提供解決方案嗎?隨著所有的轉變,我感到非常頭暈。

  1. 概率積分的值似乎演變平穩。如何用一些函數來近似它?

您的結果似乎不正確。這很容易看出,無需任何計算,因為在您的表格中,您的 $ E[X_{(1)}] $ 隨著樣本量的增加 $ n $ ; 顯然,樣本最小值的期望值必須隨著樣本量變(即變得更負) $ n $ 變大。

這個問題在概念上很容易。

簡而言之:如果 $ X $ ~ $ N(0,1) $ 帶PDF $ f(x) $ :

在此處輸入圖像描述

…然後是一階統計數據的pdf(在大小樣本中 $ n $ ) 是:

在此處輸入圖像描述

…在此處使用 中的OrderStat函數獲得mathStatica,具有支持域:

在此處輸入圖像描述

然後, $ E[X_{(1)}] $ , 為了 $ n = 1,2,3 $ 可以很容易地完全得到:

在此處輸入圖像描述

最正確 $ n = 3 $ 情況大約是 $ -0.846284 $ ,這顯然與您的 -1.06(表的第 1 行)的工作方式不同,因此您的工作方式似乎很明顯有問題(或者我對您正在尋找的東西的理解)。

為了 $ n \ge 4 $ ,獲得封閉形式的解決方案更加棘手,但即使符號積分證明很困難,我們也可以始終使用數值積分(如果需要,可以使用任意精度)。這真的很容易……例如,這裡是 $ E[X_{(1)}] $ , 對於樣本量 $ n = 1 $ 到 14,使用Mathematica

sol = Table[NIntegrate[x g, {x, -Infinity, Infinity}], {n, 1, 14}]

{0., -0.56419, -0.846284, -1.02938, -1.16296, -1.26721, -1.35218, -1.4236, -1.48501, -1.53875, -1.58644, -1.62923, -1.66799, -1.70338}

全做完了。這些值顯然與表中的值(右側列)非常不同。

考慮更一般的情況 $ N(\mu, \sigma^2) $ 父母,完全按照上面的方法進行,從一般的 Normal pdf 開始。

引用自:https://stats.stackexchange.com/questions/77692

comments powered by Disqus