Maximum-Likelihood

指數分佈的 ML 估計(使用刪失數據)

  • January 14, 2015

在生存分析中,您假設 rv 的生存時間呈指數分佈。現在考慮到我有iid rv的“結果”. 這些結果中只有一部分實際上是“完全實現”的,即剩餘的觀察結果仍然“有效”。

如果我想對速率參數執行 ML 估計關於分佈,我如何以連貫/適當的方式利用未實現的觀察結果?我相信它們仍然包含用於估計的有用信息。

有人可以指導我閱讀有關該主題的文獻嗎?我確信它存在。但是,我無法為該主題找到好的關鍵字/搜索詞。

您仍然可以直接使用似然度來估計參數。讓觀察結果 指數分佈 率並且未知。密度函數為, 累積分佈函數和尾函數. 假設第一個觀察得到充分觀察,而對於我們只知道對於一些已知的正常數. 與往常一樣,可能性是“觀察數據的概率”,對於刪失的觀察,由下式給出, 所以全似然函數是

然後對數似然函數變為

它與通常的、完全觀察到的情況的對數似然具有相同的形式,除了第一項代替. 寫作對於觀測值和刪失時間的平均值,最大似然估計變成,您自己可以將其與完全觀察到的情況進行比較。

EDIT   

嘗試回答評論中的問題:如果所有觀察都被審查,也就是說,我們沒有等待足夠長的時間來觀察任何事件(死亡),我們能做什麼?在這種情況下,,所以對數似然變成

也就是說,它是線性遞減的. 所以最大值必須是!但是,零不是 rate 參數的有效值因為它不對應於任何指數分佈。我們必須得出結論,在這種情況下,最大似然估計量不存在!也許人們可以嘗試構建某種置信區間基於該對數似然函數?為此,請看下面。 但是,無論如何,從那種情況下的數據中得出的真正結論是,我們應該等待更多的時間,直到我們得到一些事件……

以下是我們如何構建(單邊)置信區間以防所有觀察結果都被審查。這種情況下的似然函數是,它與我們獲得所有成功的二項式實驗的似然函數具有相同的形式,即(另見0 或 1 二項式估計的置信區間)。在這種情況下,我們想要一個單邊的置信區間形式的. 然後我們得到一個區間通過解決.

我們得到置信區間通過解決

以便. 這最終給出了置信區間:

引用自:https://stats.stackexchange.com/questions/133347

comments powered by Disqus