Confidence-Interval

澄清解釋置信區間?

  • June 5, 2011

我目前對“置信區間與置信水平”概念的理解" 是如果我們嘗試多次計算置信區間(每次都使用新樣本),它將包含正確的參數的時間。

儘管我意識到這與“真實參數位於此區間內的概率”不同,但我想澄清一些事情。

【重大更新】

在我們計算 95% 的置信區間之前,我們計算的區間有 95% 的概率覆蓋真實參數。在我們計算出置信區間並獲得特定區間之後,我們不能再這樣說了。我們甚至不能做出某種非頻率論的論點,我們 95% 確定真正的參數將位於; 因為如果我們可以的話,它會與下面的反例相矛盾:確切地說,置信區間是什麼?

我不想讓這成為一場關於概率哲學的辯論。相反,我正在尋找關於如何以及為什麼看到特定間隔的精確數學解釋改變(或不改變)我們在看到那個間隔之前的 95% 概率。如果您爭辯說“在看到區間之後,概率的概念不再有意義”,那麼好吧,讓我們來解釋它確實有意義的概率。

更確切地說:

假設我們對計算機進行編程以計算 95% 的置信區間。計算機進行一些數字運算,計算間隔,並拒絕顯示間隔,直到我輸入密碼。在我輸入密碼並看到區間之前(但在計算機已經計算出來之後),區間包含真實參數的概率是多少?它是 95%,這部分沒有爭議:這是我對這個特定問題感興趣的概率的解釋(我意識到我正在壓制一些主要的哲學問題,這是故意的)。

但是只要我輸入密碼並讓計算機顯示它計算的間隔,概率(間隔包含真實參數)就會改變。任何聲稱這種概率永遠不會改變的說法都與上面的反例相矛盾。在這個反例中,概率可能會從 50% 變為 100%,但是……

  • 是否有任何例子表明概率變為 100% 或 0% 以外的值(編輯:如果是,它們是什麼)?
  • 有沒有看到特定間隔後概率不變的例子(即真實參數所在的概率仍然是 95%)?
  • 看到計算機吐出後,概率一般如何(以及為什麼)發生變化?

[編輯]

感謝所有出色的答案和有益的討論!

我認為根本問題是頻率統計只能為具有長期頻率的事物分配概率。一個參數的真實值是否在一個特定的區間內並沒有一個長期的運行頻率,因為我們只能進行一次實驗,所以你不能給它分配一個頻率分佈的概率。問題源於概率的定義。如果您將概率的定義更改為貝葉斯定義,那麼問題會立即消失,因為您不再需要討論長期頻率。

在這裡查看我對相關問題的回答(相當厚臉皮):

頻率論者是相信概率代表事件發生的長期頻率的人;如果需要,他會發明一個虛構的總體,您的特定情況可以被視為隨機樣本,這樣他就可以有意義地談論長期頻率。如果你問他一個關於特定情況的問題,他不會直接回答,而是對這個(可能是虛構的)人口做出陳述。

在置信區間的情況下,我們通常想問的問題(除非我們在質量控制方面遇到問題)是“給定這個數據樣本,返回包含具有概率的參數真實值的最小區間X”。然而,常客不能這樣做,因為實驗只進行一次,因此沒有可用於分配概率的長期運行頻率。因此,頻率論者必鬚髮明一組實驗(您沒有執行),您執行的實驗可以被認為是隨機樣本。然後,常客會給你一個關於虛構實驗群體的間接答案,而不是你真正想問的關於特定實驗的問題的直接答案。

從本質上講,這是一個語言問題,種群的常客定義根本不允許討論參數的真實值位於特定區間內的概率。這並不意味著常客統計數據不好或沒有用,但了解其局限性很重要。

關於重大更新

我不確定我們是否可以說“在我們計算 95% 的置信區間之前,我們計算的區間有 95% 的概率覆蓋真實參數。” 在頻率論框架內。這裡有一個隱含的推論,即參數的真實值位於通過某種特定方法構建的置信區間的長期頻率也是該參數的真實值位於特定樣本的置信區間的概率我們將要使用的數據。這是一個完全合理的推斷,但它是貝葉斯推斷,而不是頻率論推斷,因為參數的真實值位於我們為特定數據樣本構建的置信區間內的概率沒有長期運行頻率,因為我們只有一個數據樣本。

然而,我們可以“提出某種非頻率論論點,我們 95% 確定真正的參數將位於 [a,b] 中”,這正是貝葉斯可信區間的含義,對於許多問題,貝葉斯可信區間與常客置信區間完全一致。

“我不想讓這成為一場關於概率哲學的辯論”,遺憾的是這是不可避免的,因為你不能將統計的真實值是否在置信區間中分配頻率概率的原因是直接後果頻率論的概率哲學。頻率論者只能將概率分配給具有長期頻率的事物,因為頻率論者在他們的哲學中是如何定義概率的。這並沒有使頻率論哲學錯誤,但重要的是理解概率定義所施加的界限。

“在我輸入密碼並看到區間之前(但在計算機已經計算出來之後),區間包含真實參數的概率是多少?是95%,這部分沒有爭議:”這個是不正確的,或者至少在做出這樣的陳述時,您已經脫離了頻率統計的框架,並且做出了貝葉斯推斷,其中涉及陳述真實性的一定程度的合理性,而不是長期頻率。然而,正如我之前所說,這是一個完全合理和自然的推論。

輸入密碼之前或之後沒有任何變化,因為這兩個事件都不能被賦予頻率概率。頻率統計可能相當違反直覺,因為我們經常想詢問有關特定事件的陳述的合理程度的問題,但這超出了頻率統計的範圍,這是對頻率程序的大多數誤解的根源。

引用自:https://stats.stackexchange.com/questions/11609

comments powered by Disqus

相關問答