Distributions

截斷分佈的最大似然估計量

  • January 30, 2013

考慮獨立樣本從隨機變量中獲得假設遵循已知(有限)最小值和最大值的截斷分佈(例如截斷正態分佈)和但參數未知和. 如果遵循非截斷分佈,最大似然估計和為了和從將是樣本均值和样本方差. 但是,對於截斷分佈,以這種方式定義的樣本方差受所以它並不總是一個一致的估計量:對於,它不能在概率上收斂到作為走向無窮大。所以看起來和不是最大似然估計量和對於截斷分佈。當然,這是可以預料的,因為和截斷正態分佈的參數不是它的均值和方差。

那麼,最大似然估計量是多少和已知最小值和最大值的截斷分佈的參數?

考慮由“標準”分佈確定的任何位置尺度族,

假設可微分,我們很容易發現 PDF 是.

截斷這些分佈以限制它們之間的支持和,, 表示 PDF 被替換為

(並且對於所有其他值為零) 在哪裡是確保融為一體。(注意是相同的在沒有截斷的情況下。)iid 數據的對數似然因此是

找到臨界點(包括任何全局最小值)(我將在這裡忽略一個特殊情況)或梯度消失。使用下標表示導數,我們可以正式計算梯度並將似然方程寫為

因為和已修復,將它們從符號中刪除並寫入作為和作為. (沒有截斷,兩個函數都為零。)將涉及數據的項與其餘項分開給出

通過將這些與不截斷情況進行比較,很明顯

  • 原始問題的任何足夠的統計數據都足以解決截斷問題(因為右手邊沒有改變)。
  • 我們找到封閉形式解決方案的能力取決於和. 如果這些不涉及和以簡單的方式,我們不能希望獲得一般的封閉形式的解決方案。

對於一個普通家庭來說,當然是由累積正態 PDF 給出的,它是誤差函數的差異:通常不可能獲得封閉形式的解。但是,只有兩個足夠的統計量(樣本均值和方差即可),並且 CDF 盡可能平滑,因此數值解相對容易獲得。

引用自:https://stats.stackexchange.com/questions/48897

comments powered by Disqus