在給定參考人群的情況下估計成功概率
假設您有以下情況:
隨著時間的推移,您觀察了 1000 名保齡球運動員,他們每人打的比賽相對較少(比如 1 到 20 場)。你注意到這些球員中每個球員的罷工百分比與每個球員參加的比賽數量相比。
一名新的保齡球運動員上場打了 10 場比賽並獲得 3 次好球。
假設任何球員的罷工次數分佈是二項式的。
我想估計那個玩家成功的“真實”概率。
請注意以下事項:
- 這不是真實的情況,也不是學校的問題,只是一個自我思考的問題。
- 我是一個統計教育比統計 101 課程多一點的學生。我對最大似然估計之類的推理知之甚少……所以請隨時告訴我應該閱讀的統計數據領域。
- 我的問題可能缺乏信息,或者如果它有利於成功概率的分佈近似正常,請告訴我。
非常感謝你
這是一個很好的例子來說明常客和貝葉斯推理方法之間的區別。
我的第一個簡單的常客回答: 如果您已經假設罷工的分佈是二項式的,那麼您不需要了解其他 1000 名玩家的任何信息(也許您可以使用它們來檢查您的二項式假設)。
一旦明確了二項式假設,您的估計就非常簡單:3/10。這個估計的方差是通常的 p(1-p)/n = 0.021。
基本上,這 1000 名其他玩家是無關緊要的,除非你認為罷工分佈有一些有趣且非二項式的東西(例如,人們玩的遊戲越多越好)。
一種更深思熟慮的貝葉斯方法: 或者,如果您有興趣應用您從其他玩家那裡獲得的先驗知識,並且您認為新玩家基本上是來自同一人群的新樣本,您應該在貝葉斯中考慮它條款。
估計玩家的先驗分佈。為此,您需要查看您的 1000 個數據點 - 已經觀察到的 1000 名球員,您可以估計每個球員的罷工概率。這 1000 個點中的每一個只能取 21 個值中的一個(從 0 到 20 個打擊,共 20 個),您將看到整個場地的分佈。如果您將這些分數轉換為比例(即介於 0 和 1 之間),則可以通過具有Beta 分佈的隨機變量的概率分佈來合理地近似此分佈. Beta 分佈完全由兩個參數來表徵 - 比如說 a 和 b - 但是因為這些參數與您向我們詢問的分佈(特定玩家自己的罷工概率)並沒有真正的關係,而是更高級別的分佈,我們稱它們為超參數。您可以通過與您的問題的重點無關的多種方式之一,從您的 1000 個數據點開發這些超參數的估計值。
在您完全了解球員的任何信息之前,您對他/她的得分比例(我們稱之為 p)的最佳猜測將只是我們剛剛擬合的 Beta 分佈中 p 的最可能值。
但是,我們有關於我們自己的玩家的數據,而不僅僅是普通人群! 在我們相信的上帝中,所有其他人都必須帶來數據(如果我記得我在哪裡找到它,我會註明這句話,對不起)。每次我們觀察我們的球員玩遊戲並獲得罷工,我們都有一條新的信息來精確我們對他的比例的估計。
貝塔分佈作為一個比例的概率分佈的一個巧妙之處在於,當我們從數據中收集新信息並創建一個新的、改進的比例估計時,概率論可以表明新的改進的估計也是貝塔分發 - 只是一個更集中的版本。這是因為在嘗試對二項式模型進行估計時,Beta 分佈是所謂的共軛先驗。
也就是說,如果我們觀察到 n 個成功事件中的 z 個(在這種情況下是有罷工的遊戲);且先驗分佈為 beta(a,b);後驗分佈(在給定原始 1000 個數據點的情況下估計 p 的概率分佈,並且是對十場比賽的新觀察)是 beta(a+z, b+nz) 或(在我們的例子中)beta(a+3, b+7)。如您所見,獲得的數據越多,a 和 b 的重要性就越低。這個數學相當簡單,並且在許多文本中,但不是那麼有趣(無論如何對我來說)。
如果你有 R,你可以通過運行下面的代碼來查看一個例子(如果你沒有 R,你應該得到它——它是免費的,它對於幫助思考這類問題非常棒)。這假設玩家的先驗分佈可以用 beta(2,5) 建模——這只是我編造的。實際上,您可以通過多種方式估算 a 和 b 的數字,而不是僅僅彌補 2 和 5,因為我認為曲線看起來不錯。
如果您運行這個程式化的示例,您將看到,在給定 beta(2,5) 的先驗分佈的情況下,玩家得分的概率的點估計是 0.29 而不是 0.30。此外,我們可以創建一個可信區間,坦率地說,它比置信區間更直觀、更容易解釋(參見互聯網上關於兩者之間差異的許多問題和討論,包括 CrossValidated)。
plot(0:100/100,dbeta(0:100/100,2,5), type="l", ylim=c(0,4), bty="l") lines(0:100/100,dbeta(0:100/100,2+3,5+7), type="l", lty=2) legend(0.6,3.5,c("Posterior distribution", "Prior distribution"), lty=2:1, bty="n") qbeta(c(0.025, 0.975), 2, 5) # credibility interval prior to any new data qbeta(c(0.025, 0.975), 2+3, 5+7) # credibility interval posterior to data qbeta(0.5, 2+3, 5+7) # point estimate of p, posterior to data
然後觀察你的新玩家;並為新玩家計算新的後驗分佈。這實際上是說“鑑於我們剛剛觀察到的情況,我們認為這個人最有可能在玩家分佈的哪個位置?”