所有對數似然函數都可二次微分嗎？

June 11, 2021

對於最大似然估計，我們需要設置對數似然函數的一階導數等於 .

Hessian 矩陣的負期望值（二階導數）則稱為 Fisher 信息矩陣。

對數似然（概率密度）函數的定義是否有任何固有的東西，可以保證對數似然的兩倍微分？如果不是，我必須施加什麼條件來保證？

簡而言之：沒有。請注意，為了最大化對數似然，我們經常使用微分，但實際上要真正最大化一個函數，我們需要考慮幾種類型的點

靜止/轉折點（當 )

奇異點（例如功能無法區分的地方）

端點 - 這僅適用於有限間隔，可能與其中之一要么模數無窮大

當然，前提是感興趣的參數實際上是連續的。

讓我們考慮帶密度的拉普拉斯分佈

那麼對數似然是，給定一個樣本大小的

可以證明 . 困難的一點是找到 .

現在，如果我們區分 wrt 那麼我們需要區分 . 如果對於任何然後僅當_ 是偶數（但仍然可能不為零！）。在任何漸變不存在！.

現在對於任何等於其中之一，對數似然在這些點上是不可微的。現在假設是奇數，可以證明實際上是樣本中位數。樣本中位數將是其中之一（中間當。。。的時候是有序的）。因此，mle 位於不可微分點之一——奇點！

我們如何保證對數似然是可微的？我不認為我們實際上可以強迫這是真的*，除非*我們選擇一個兩倍可微的對數似然。我認為這是一種建模選擇或假設。而不是我們可以保證的東西。其他假設可能意味著兩次可微的對數似然，但總的來說，我看不出我們最終會如何得到這樣的對數似然。

引用自：https://stats.stackexchange.com/questions/530253

所有對數似然函數都可二次微分嗎？

相關問答

在貝葉斯統計中，數據被認為是非隨機的，但可以有概率或有條件。如何？

為什麼似然函數有時是 PDF的直覺

為什麼密度函數有時用條件表示法編寫？

什麼是“似然原則”？

如果我知道我估計的密度關於 0 對稱，如何在我的核密度估計器中施加這個限制？

協方差矩陣和協方差矩陣的逆矩陣之間的幾何關係是什麼？