貝葉斯先驗是否與大樣本量無關?
在執行貝葉斯推理時,我們通過結合我們對參數的先驗來最大化我們的似然函數。因為對數似然更方便,我們有效地最大化使用 MCMC 或其他生成後驗分佈的方法(對每個參數的先驗和每個數據點的可能性使用 pdf)。
如果我們有大量數據,那麼通過簡單的數學計算,其中的可能性將壓倒先驗提供的任何信息。最終,這是好的,並且是設計使然;我們知道後驗將收斂到具有更多數據的可能性,因為它應該如此。
對於由共軛先驗定義的問題,這甚至可以完全證明。
有沒有辦法決定先驗對於給定的似然函數和某些樣本量何時無關緊要?
這並不容易。您的數據中的信息會壓倒先前的信息,不僅您的樣本量很大,而且當您的數據提供的信息足以壓倒先前的信息時。信息量不足的先驗很容易被數據說服,而信息量大的先驗可能更具抵抗力。在極端情況下,由於先驗定義不明確,您的數據可能根本無法克服它(例如,某些區域的密度為零)。
回想一下,根據貝葉斯定理,我們在統計模型中使用了兩種信息來源,即數據外、先驗信息和似然函數中的數據傳達的信息:
當使用無信息先驗(或最大似然)時,我們嘗試將盡可能少的先驗信息帶入我們的模型。通過信息豐富的先驗,我們將大量信息帶入模型。因此,數據和先驗都告訴我們估計參數的哪些值更合理或更可信。它們可以帶來不同的信息,並且在某些情況下,它們中的每一個都可以壓倒另一個。
讓我用非常基本的 beta-二項式模型來說明這一點(詳細示例請參見此處)。在“沒有信息”的情況下,非常小的樣本可能足以壓倒它。在下圖中,您可以看到具有不同樣本大小的同一模型的先驗(紅色曲線)、似然性(藍色曲線)和後驗(紫色曲線)。
另一方面,您可以獲得接近真實價值的信息先驗,這也很容易,但不像每周信息那麼容易,被數據說服。
當與數據所說的相差甚遠時(使用與第一個示例相同的數據),情況與信息先驗非常不同。在這種情況下,您需要更大的樣本來克服先驗。
因此,這不僅與樣本量有關,還與您的數據和先驗數據有關。請注意,這是一種期望的行為,因為在使用信息先驗時,我們希望在模型中潛在地包含數據外信息,如果大樣本總是丟棄先驗,這將是不可能的。
由於復雜的後驗-似然-先驗關係,最好查看後驗分佈並進行一些後驗預測檢查(Gelman、Meng 和 Stern,1996;Gelman 和 Hill,2006;Gelman 等,2004)。此外,如 Spiegelhalter (2004) 所述,您可以使用不同的先驗,例如表達對大效應的懷疑的“悲觀”,或對估計效應持樂觀態度的“熱情”。比較不同先驗與您的數據的行為可能有助於非正式地評估後驗受先驗影響的程度。
Spiegelhalter,DJ(2004 年)。將貝葉斯思想納入醫療保健評估。統計科學,156-174。
Gelman, A.、Carlin, JB、Stern, HS 和 Rubin, DB (2004)。貝葉斯數據分析。查普曼和霍爾/CRC。
Gelman, A. 和 Hill, J. (2006)。使用回歸和多級/分層模型進行數據分析。劍橋大學出版社。
Gelman, A.、Meng, XL 和 Stern, H. (1996)。通過已實現的差異對模型適應度進行後驗預測評估。中國統計局,733-760。