估計學生 t 分佈的參數

July 8, 2013

學生 t 分佈參數的最大似然估計量是多少？它們是否以封閉形式存在？快速谷歌搜索沒有給我任何結果。

今天我對單變量案例感興趣，但可能我必須將模型擴展到多個維度。

編輯：我實際上最感興趣的是位置和比例參數。現在我可以假設自由度參數是固定的，以後可能會使用一些數值方案來找到最優值。

T 不存在封閉形式，但一種非常直觀且穩定的方法是通過 EM 算法。現在因為學生是法線的比例混合，你可以把你的模型寫成

在哪裡和. 這意味著有條件地mle 只是加權平均值和標準差。這是“M”步

現在“E”步驟替換給出所有數據的期望。這是給出的：

因此，您只需重複上述兩個步驟，將每個方程的“右手邊”替換為當前參數估計值。

這很容易顯示 t 分佈的穩健性，因為殘差較大的觀測值在位置計算中的權重較小, 和在計算中的有限影響. “有限影響”是指對估計的貢獻從第 i 個觀察不能超過給定閾值（這是在 EM 算法中）。還是增加（減少）的“魯棒性”參數將導致更多（更少）統一的權重，因此對異常值更敏感（更少）。

需要注意的一點是，對數似然函數可能有多個固定點，因此 EM 算法可能會收斂到局部模式而不是全局模式。當位置參數開始太靠近異常值時，可能會發現局部模式。因此，從中位數開始是避免這種情況的好方法。

引用自：https://stats.stackexchange.com/questions/63647

comments powered by Disqus

估計學生 t 分佈的參數

相關問答

用最大似然法尋找類別

MLE 和非正態性

為什麼最大似然估計量對異常值是可疑的？

95% t 分佈 CI 沒有獲得 95% 的覆蓋率

為什麼我們在進行 MLE 時將對數似然乘以 -2？

具有限制參數的正態分佈的 MLE