Confidence-Interval

置信橢圓的真正含義

  • June 5, 2016

閱讀 95% 置信橢圓的真正含義時,我傾向於遇到兩種解釋:

  1. 包含 95% 數據的橢圓
  2. 不是上面的,而是解釋數據方差的橢圓。我不確定我是否理解正確,但它們似乎意味著如果有一個新的數據點進來,新的方差有 95% 的機會留在橢圓中。

你能解釋一下嗎?

實際上,這兩種解釋都不正確。

置信橢圓與未觀察到的總體參數有關,例如雙變量分佈的真實總體均值。該均值的 95% 置信橢圓實際上是具有以下屬性的算法:如果您要從基礎分佈多次復制抽樣,並且每次都計算一個置信橢圓,那麼如此構造的 95% 的橢圓將包含基礎分佈意思是。(請注意,每個樣本當然會產生不同的橢圓。)

因此,置信橢圓通常不會包含 95% 的觀測值。事實上,隨著觀察次數的增加,平均值通常會越來越好,導致置信橢圓越來越小,而置信橢圓包含的實際數據比例也越來越小。(不幸的是,有些人計算出包含 95% 數據的最小橢圓,這讓人聯想到分位數,這本身就很好……但是接著將這個“分位數橢圓”稱為“置信橢圓”,其中,如您所見,會導致混亂。)

基礎總體的方差與置信橢圓有關。高方差意味著數據遍布各處,因此無法很好地估計均值,因此置信橢圓將大於方差較小的情況。

當然,我們也可以為我們可能希望估計的任何其他總體參數計算置信橢圓。或者我們可以查看橢圓以外的其他置信區域,特別是如果我們不知道估計的參數是(漸近地)正態分佈的。

置信橢圓的一維模擬是置信區間,並且瀏覽此標籤中以前的問題很有幫助。我們當前在這個標籤中投票最高的問題特別好:為什麼 95% 的 CI 並不意味著 95% 的機會包含平均值?那裡的大部分討論同樣適用於一維置信區間的高維類似物。

引用自:https://stats.stackexchange.com/questions/217374

comments powered by Disqus

相關問答