Bayesian

常客術語中的“參數固定且數據變化”和貝葉斯術語中的“參數變化且數據固定”究竟是什麼意思?

  • October 11, 2020

我經常聽到我的問題中的這句話,我有點理解它的意思,但從來沒有清楚地了解它。希望能清楚地了解這句話的確切含義。

在頻率論哲學中,參數被視為非隨機對象,而數據被視為隨機對象,因此“參數是固定的,數據是可變的”。

在貝葉斯哲學中,參數被視為隨機對象,並且通過對觀察到的(固定)數據集進行調節來執行推理,因此“參數變化而數據是固定的”。通過將參數視為隨機對象,我們的意思是參數具有分佈,就像觀察值具有分佈一樣。

但是請注意,這種解釋是這種隨機性反映了我們對真正基礎參數的信念。換句話說,貝葉斯主義者和常客都同意存在一個真正的固定參數,但貝葉斯主義者以分佈的形式進一步編碼了對該參數可能取什麼值的信念。

為了說明哲學上的差異,考慮一個推理問題,我們的目標是為某個參數構建一個區間估計 $ \theta $ 它通過採樣分佈與模型相關聯,我們將其密度表示為 $ f(X | \theta) $ . 作為常客,您會推斷出置信區間和貝葉斯的可信區間。

在頻率論範式下,你觀察一些數據 $ X=x $ 並通過操作構建置信區間 $ x $ ,即你有一些功能 $ C $ 那映射 $ x $ 到某個間隔。因為 $ X $ 是一個隨機變量,並且 $ C $ 只是一個函數 $ X $ ,我們本質上是在構建“隨機”區間估計。該參數被視為固定的未知常數。因此置信區間的含義是這個隨機區間的概率 $ C(X) $ 捕獲固定的未知常數 $ \theta $ . 請注意,這意味著如果您觀察到說 $ 100 $ 的值 $ x $ ,並且您為每組觀察構建了一個 95% 的置信區間,您將捕獲 $ \theta $ 大約為 $ 95 $ 其中。

在貝葉斯範式下,您首先將您對參數可能採用的值的信念編碼,例如使用分佈 $ \pi_0 $ . 然後你再次觀察一些數據 $ X=x $ . 為了得出一個可信區間,您可以推斷出您更新的信念,編碼為稱為後驗分佈的分佈,我們將其表示為 $ \pi_1 $ . 後驗分佈定義為 $$ \pi_1(\theta | x) = \frac{f(x|\theta)\pi_0(\theta)}{p(x)}. $$ 在這裡,我們看到我們的後驗編碼了我們的不確定性 $ \theta $ 以分佈的形式,就像我們在觀察數據之前如何編碼我們的信念一樣。這裡的數據是固定的,因為我們的估計取決於觀察到的情況。然後將可信區間作為後驗區間。可信區間被解釋為參數在區間內取值的概率。

引用自:https://stats.stackexchange.com/questions/491436

comments powered by Disqus