Self-Study

刪失樣本的漸近分佈經驗(λ)經驗⁡(λ)exp(lambda)

  • August 28, 2016

讓是大小的獨立同分佈樣本的順序統計量從. 假設數據被審查,所以我們只看到頂部數據的百分比,即

放, 什麼是漸近分佈

這與這個問題和這個問題有點相關,也與這個問題有點相關。

任何幫助,將不勝感激。我嘗試了不同的方法,但沒有取得太大進展。

自從只是一個比例因子,在不失一般性的情況下選擇使, 使底層分佈函數有密度.

從與樣本中位數中心極限定理平行的考慮,漸近正態,均值和方差

由於指數分佈的無記憶性,變量就像一個隨機樣本的順序統計從, 其中已添加。寫作

對於他們的平均值,立即是平均值(等於) 和方差是乘以方差(也等於)。中心極限定理意味著標準化是漸近標準正態的。此外,因為有條件地獨立於,我們同時有標準版本的漸近標準正態且與. 那是,

漸近地具有雙變量標準正態分佈。


樣本模擬數據的圖形報告(迭代)和. 仍然存在一絲正偏度,但二元正態性的方法在兩者之間缺乏關係是顯而易見的和以及直方圖與標準正態密度的接近程度(以紅點顯示)。 數字

標準化值的協方差矩陣(如公式) 對於這個模擬是

舒適地接近它近似的單位矩陣。 R生成這些圖形的代碼很容易修改以研究其他值,, 和模擬大小。

n <- 1e3
p <- 0.95
n.sim <- 5e3
#
# Perform the simulation.
# X_m will be in the first column and Y in the second.
#
set.seed(17)
m <- floor(p * n)
X <- apply(matrix(rexp(n.sim * n), nrow = n), 2, sort)
X <- cbind(X[m, ], colMeans(X[(m+1):n, , drop=FALSE]))
#
# Display the results.
#
par(mfrow=c(2,2))

plot(X[,1], X[,2], pch=16, col="#00000020", 
    xlab=expression(X[(m)]), ylab="Y",
    main="Y vs X", sub=paste("n =", n, "and p =", signif(p, 2)))

plot(X[,1], X[,2]-X[,1], pch=16, col="#00000020", 
    xlab=expression(X[(m)]), ylab=expression(Y - X[(m)]),
    main="Y-X vs X", sub="Loess smooth shown")
lines(lowess(X[,2]-X[,1] ~ X[,1]), col="Red", lwd=3, lty=1)

x <- (X[,1] + log(1-p))  / sqrt(p/(n*(1-p)))
hist(x, main="Standardized X", freq=FALSE, xlab="Value")
curve(dnorm(x), add=TRUE, col="Red", lty=3, lwd=2)

y <- (X[,2] - X[,1] - 1) * sqrt(n-m)
hist(y, main="Standardized Y-X", freq=FALSE, xlab="Value")
curve(dnorm(x), add=TRUE, col="Red", lty=3, lwd=2)
par(mfrow=c(1,1))

round(var(cbind(x,y)), 3) # Should be close to the unit matrix

引用自:https://stats.stackexchange.com/questions/232184

comments powered by Disqus