Estimation
估計學生 t 分佈的參數
學生 t 分佈參數的最大似然估計量是多少?它們是否以封閉形式存在?快速谷歌搜索沒有給我任何結果。
今天我對單變量案例感興趣,但可能我必須將模型擴展到多個維度。
編輯:我實際上最感興趣的是位置和比例參數。現在我可以假設自由度參數是固定的,以後可能會使用一些數值方案來找到最優值。
T 不存在封閉形式,但一種非常直觀且穩定的方法是通過 EM 算法。現在因為學生是法線的比例混合,你可以把你的模型寫成
在哪裡和. 這意味著有條件地mle 只是加權平均值和標準差。這是“M”步
現在“E”步驟替換給出所有數據的期望。這是給出的:
因此,您只需重複上述兩個步驟,將每個方程的“右手邊”替換為當前參數估計值。
這很容易顯示 t 分佈的穩健性,因為殘差較大的觀測值在位置計算中的權重較小, 和在計算中的有限影響. “有限影響”是指對估計的貢獻從第 i 個觀察不能超過給定閾值(這是在 EM 算法中)。還是增加(減少)的“魯棒性”參數將導致更多(更少)統一的權重,因此對異常值更敏感(更少)。
需要注意的一點是,對數似然函數可能有多個固定點,因此 EM 算法可能會收斂到局部模式而不是全局模式。當位置參數開始太靠近異常值時,可能會發現局部模式。因此,從中位數開始是避免這種情況的好方法。