如何形式化先驗概率分佈?是否有應該使用的經驗法則或技巧?
雖然我喜歡認為我很好地掌握了貝葉斯統計分析和決策中的先驗信息的概念,但我常常難以理解它的應用。我想到了幾個例子來說明我的掙扎,我覺得到目前為止我讀過的貝葉斯統計教科書沒有正確解決它們:
假設幾年前我進行了一項調查,表明 68% 的人有興趣購買 ACME 產品。我決定再次進行調查。雖然我將使用與上次相同的樣本量(例如,n=400),但從那時起人們的意見可能已經發生了變化。但是,如果我使用 beta 分佈作為先驗,其中 400 名受訪者中有 272 人回答“是”,我會給予我幾年前進行的調查和我現在進行的調查同等的權重。是否有一個經驗法則可以確定我想放在先驗的更大不確定性,因為該數據已有幾年的歷史?我知道我可以將先驗值從 272/400 減少到比如說 136/200,但這感覺非常武斷,我想知道是否有某種形式的理由,也許在文獻中,
再舉一個例子,假設我們即將進行臨床試驗。在啟動試驗之前,我們進行了一些可以用作先前信息的二次研究,包括專家意見、先前臨床試驗的結果(相關性不同)、其他基本科學事實等。如何結合這些信息範圍(其中一些本質上是非定量的)到先驗概率分佈?這僅僅是決定選擇哪個家庭並使其擴散到足以確保它被數據淹沒的情況,還是已經做了很多工作來建立一個信息量相當大的先驗分佈?
您在 400 次嘗試中處理 272 次成功的先驗信息的想法確實具有相當可靠的貝葉斯證明。
正如您所認識到的,您正在處理的問題是估計成功概率的問題伯努利實驗。Beta 分佈是相應的“共軛先驗”。這種共軛先驗享有“虛構樣本解釋”:
Beta先驗是
這可以解釋為包含在大小樣本中的信息(大致如此,如當然不必是整數)與成功:
因此,如果你採取和,這對應於先驗參數和. “減半”樣本將導致先驗參數和. 現在,回想一下 beta 分佈的先驗均值和先驗方差由下式給出
將樣本減半保持先驗均值(幾乎)不變:
alpha01 <- 273 beta01 <- 129 (mean01 <- alpha01/(alpha01+beta01)) alpha02 <- 137 beta02 <- 65 (mean02 <- alpha02/(alpha02+beta02))
但增加了先驗方差
(priorvariance01 <- (alpha01*beta01)/((alpha01+beta01)^2*(alpha01+beta01+1))) [1] 0.0005407484
到
(priorvariance02 <- (alpha02*beta02)/((alpha02+beta02)^2*(alpha02+beta02+1))) [1] 0.001075066
如預期的。