Prediction

有哪些非貝葉斯方法可用於預測推理?

  • September 1, 2015

在貝葉斯推理中,未來數據的預測分佈是通過整合未知參數得出的;對這些參數的後驗分佈進行積分得到後驗預測分佈——未來數據的分佈以已經觀察到的數據為條件。有哪些用於預測推理的非貝葉斯方法考慮到參數估計中的不確定性(即不只是將最大似然估計或其他任何東西插入到密度函數中)?

每個人都知道如何計算線性回歸後的預測區間,但是計算背後的原理是什麼以及如何將它們應用於其他情況(例如,在從數據中估計速率參數後計算新指數變量的精確預測區間)?

非貝葉斯預測推理(除了 SLR 案例)是一個相對較新的領域。在“非貝葉斯”的標題下,我們可以將這些方法細分為“經典”常客與那些基於“可能性”的方法。

經典頻率論預測

如您所知,頻率論中的“金標準”是在重複採樣下實現標稱覆蓋。例如,我們希望 95% 的置信區域包含來自同一基礎總體的 95% 樣本中的真實參數。或者,我們期望在假設檢驗中犯的 I 類和 II 類錯誤平均等於和. 最後,與這個問題最密切相關的是,我們預計 95% 的預測區間將在 95% 的時間內包含下一個樣本點

現在,我通常對在大多數統計課程中如何呈現和教授經典 PI 有疑問,因為壓倒性的趨勢是將這些解釋為貝葉斯後驗預測區間,而它們顯然不是。最根本的是,他們在談論不同的概率!貝葉斯沒有對其數量的重複抽樣性能提出任何要求(否則,他們將成為常客)。其次,貝葉斯 PI 實際上在精神上完成了與經典容差區間更相似的事情,而不是經典預測區間。

供參考:容差區間需要由兩個概率指定:置信度和覆蓋率。置信度告訴我們它在重複樣本中正確的頻率。覆蓋率告訴我們真實分佈下區間的最小 概率測度(與 PI 相反,PI 給出了預期的概率測度……再次在重複採樣下)。這基本上也是貝葉斯 PI 試圖做的事情,但沒有任何重複抽樣聲明。

所以,Stats 101 Simple Linear Regression 的基本邏輯是在正態性假設下推導出 PI 的重複採樣屬性。它的常客+高斯方法通常被認為是“經典的”,並在介紹統計課程中教授。這是基於結果計算的簡單性(參見維基百科以獲得很好的概述)。

非高斯概率分佈通常是有問題的,因為它們可能缺少可以巧妙地反轉以獲得區間的*關鍵量。*因此,這些分佈沒有“精確”的方法,通常是因為區間的屬性取決於真正的基礎參數。

承認這種無能,用似然法出現了另一類預測(以及推理和估計)。

基於似然的推理

與許多現代統計概念一樣,基於可能性的方法可以追溯到 Ronald Fisher。該學派的基本思想是,除了特殊情況外,我們的統計推斷在邏輯上比我們處理正態分佈(其參數估計是正交的)推斷時更弱,在那裡我們可以做出準確的概率陳述。在這種推論觀點中,人們應該真正避免關於概率的陳述,除非是在確切的情況下,否則,應該對可能性做出陳述,並承認人們不知道錯誤的確切概率(在頻率論意義上)。

因此,我們可以將可能性視為類似於貝葉斯概率,但沒有可積性要求或可能與頻率論概率混淆。它的解釋完全是主觀的……儘管對於單參數推斷,通常建議使用 0.15 的似然比。

然而,人們並不經常看到明確給出“似然區間”的論文。為什麼?看來這在很大程度上是一個社會學問題,因為我們都已經習慣了基於概率的置信度陳述。相反,您經常看到的是作者指的是某某的“近似”或“漸近”置信區間。這些區間主要來自似然方法,我們依賴似然比的漸近卡方分佈,就像我們依賴樣本均值的漸近正態性一樣。

有了這個“修復”,我們現在可以構建“近似”95% 置信區域,其邏輯一致性幾乎與貝葉斯算法一樣多。

可能性框架中從 CI 到 PI

上述可能性方法的成功和易用性引發了關於如何將其擴展到預測的想法。這裡給出了一篇非常好的調查文章(我不會復制它的優秀報導)。它可以追溯到 1970 年代後期的 David Hinkley(參見JSTOR),他創造了這個術語。他將其應用於常年“皮爾遜二項式預測問題”。我將總結基本邏輯。

基本的見解是,如果我們包括一個觀察到的數據點,比如說,在我們的樣本中,然後對而不是一個固定的參數,那麼我們得到的不僅僅是一個似然函數,而是一個分佈(未歸一化),因為“參數”實際上是隨機的,因此可以在邏輯上分配一個常客概率。這個特定問題的機制在我提供的鏈接中進行了審查。

擺脫“討厭”參數以獲得預測可能性的基本規則如下:

  1. 如果一個參數是固定的(例如,),然後從可能性中對其進行分析
  2. 如果一個參數是隨機的(例如,其他未觀察到的數據或“隨機效應”),那麼您將它們整合出來(就像在貝葉斯方法中一樣)。

固定參數和隨機參數之間的區別是似然推斷所獨有的,但與混合效應模型有關,在混合效應模型中,貝葉斯、常客和似然框架似乎相互衝突。

希望這回答了您關於“非貝葉斯”預測的廣泛領域(以及相關推斷)的問題。由於超鏈接可以更改,我還將為“在所有可能性中:使用可能性的統計建模和推理”一書做一個插件,該書深入討論了現代可能性框架,包括可能性與貝葉斯與頻率論的相當多的認識論問題推理和預測。


參考

  1. 預測區間:非參數方法。維基百科。於 2015 年 9 月 13 日訪問。
  2. Bjornstad, Jan F.*預測可能性:回顧。*統計學家。科學。5 (1990), 沒有。2, 242–254。doi:10.1214/ss/1177012175。 http://projecteuclid.org/euclid.ss/1177012175
  3. 大衛·欣克利。預測可能性。統計年鑑卷。7, No. 4 (Jul., 1979), pp. 718-728 Published by: Institute of Mathematical Statistics Stable URL: http://www.jstor.org/stable/2958920
  4. 尤迪·帕維坦。在所有可能性中:使用可能性的統計建模和推理。 牛津大學出版社; 1 版(2001 年 8 月 30 日)。ISBN-10:0198507658,ISBN-13:978-0198507659。尤其是第 5.5-5.9、10 和 16 章。

引用自:https://stats.stackexchange.com/questions/169623

comments powered by Disqus