Bayesian

貝葉斯生存分析:請為 Kaplan Meier 寫一個先驗!

  • March 18, 2014

考慮右刪失的觀察,有時會發生事件. 同一時間易感個體的數量是,以及當時的事件數是.

當生存函數是階躍函數時,Kaplan-Meier 或乘積估計量自然會作為 MLE 出現. 那麼可能性是

並且 MLE 是. 好的,現在假設我想去貝葉斯。我需要某種“自然”的先驗,然後我會乘以它, 對?

谷歌搜索明顯的關鍵字,我發現 Dirichlet 過程是一個很好的先驗。但據我了解,它也是不連續點的先驗?

這肯定很有趣,我很想了解它,但是我會滿足於更簡單的東西。我開始懷疑這並不像我最初想像的那麼容易,是時候徵求你的意見了……

提前謝謝了!

PS:我希望我對處理 Dirichlet 過程的方式感興趣(盡可能簡單)的一些精確解釋,但是我認為應該可以在— 這是在階躍函數中具有不連續性的先驗.

我認為先前採樣的階躍函數的“全局形狀”不應該取決於’s - 應該有一個基本的連續函數族,這些函數近似於這些階躍函數。

我不知道如果應該是獨立的(我懷疑)。如果是,我認為這意味著先前依賴於取決於, 如果我們將其分佈表示為那麼a的乘積由獨立變量變量是一個多變的。看來這裡的日誌-變量可能很有用。

但在這里基本上我被卡住了。我一開始沒有輸入這個,因為我不想把所有的答案都指向這個方向。我將特別感謝參考書目的答案,以幫助我證明我的最終選擇。

請注意,因為您的似然函數是函數 - 數據告訴你沒有證據表明它們之間存在相關性。請注意,變量已經在縮放以考慮時間。更長的時間段意味著更多的事件機會,通常意味著更大.

這裡“去貝葉斯”的最基本方法是使用獨立的統一先驗. 注意所以這是一個適當的先驗 - 因此後驗也是適當的。後驗是帶參數的獨立 beta 分佈. 這可以很容易地模擬以生成生存曲線的後驗分佈,rbeta ()例如使用 R 中的函數。

我認為這解決了您關於“更簡單”方法的主要問題。以下只是創建更好模型的想法的開始,該模型保留了生存函數的靈活 KM 形式。

我認為 KM 曲線的主要問題在於生存功能,而不是之前的功能。例如,為什麼要值對應於觀察到的時間點?根據實際過程將它們放置在與有意義的事件時間相對應的點上不是更有意義嗎?如果觀察到的時間點相距太遠,KM 曲線將“過於平滑”。如果它們太接近,KM 曲線將“太粗糙”,並可能表現出突變。處理“太粗糙”問題的一種方法是將相關的先驗放在這樣. 這個先驗的效果是將附近的參數縮小到一起。您可以在“對數賠率”空間中使用它 並在之前使用 k 階隨機遊走. 對於一階隨機遊走,這會引入以下形式的懲罰進入對數似然。BayesX 軟件有一些關於這種平滑的非常好的文檔。基本上選擇階 k 就像做一個 k 階局部多項式。如果您喜歡樣條曲線,請選擇 k=3。當然,通過使用“精細”時間網格,您將獲得沒有觀察的時間點。Howdver,這會使您的似然函數複雜化,因為有些人失踪了. 例如,如果被分成3個“更精細”的間隔 那你不知道但只有和. 因此,您可能需要添加這些“缺失數據”並使用 EM 算法或 VB(前提是您沒有走 mcmc 路徑)。

希望這能給你一個開始。

引用自:https://stats.stackexchange.com/questions/90425

comments powered by Disqus