Confidence-Interval

QQ線的置信區間

  • August 9, 2014

這個問題並不具體涉及R,但我選擇用R它來說明它。

考慮在(正常)qq 線上生成置信帶的代碼:

library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")

我正在尋找有關如何構建這些置信帶的解釋(或替代文件/在線文檔的鏈接)(我在 R 的幫助文件中看到了對 Fox 2002 的引用,但遺憾的是我沒有這個書方便)。

我的問題將通過一個例子變得更加精確。以下是R計算這些特定 CI 的方法(我已經縮短/簡化了 中使用的代碼car::qqPlot

x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)     #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")

問題是:用於計算這些 SE 的公式的理由是什麼(例如 line SE<-(b/dnorm(z))*sqrt(P*(1-P)/n))。

FWIW 這個公式與線性回歸中常用的置信帶公式有很大不同

它與 訂單統計的分佈有關

尤其是漸近結果: 正如 COOLSerdash 在評論中提到的那樣,John Fox [1] 在第 35-36 頁上寫道:

訂單統計的標準誤是

在哪裡是對應於 CDF 的概率密度函數. 沿著擬合線的值由下式給出. 因此,圍繞擬合線的大約 95% 置信“包絡線”是.

那麼我們只需要認識到估計為.

[1] Fox, J. (2008),

應用回歸分析和廣義線性模型,第 2 版。,

賢者出版公司

引用自:https://stats.stackexchange.com/questions/111288

comments powered by Disqus