Likelihood
人們為什麼使用(𝜃|𝑥)大號(θ|X)mathcal{L}(theta|x)為了可能性而不是𝑃(𝑥|𝜃)磷(X|θ)P(x|theta)?
根據維基百科文章似然函數,似然函數定義為:
帶參數和觀察到的數據. 這等於或者取決於符號和是否被視為隨機變量或固定值。
符號對我來說似乎是一個不必要的抽象。使用有什麼好處嗎,或者可以等效地使用? 為何是介紹?
可能性是一個函數 $ \theta $ , 給定 $ x $ , 儘管 $ P $ 是一個函數 $ x $ , 給定 $ \theta $ .
- 似然函數不是密度(或 pmf)——它不會積分(/sum)為 1。
- 的確, $ \mathcal L $ 可能是連續的,而 $ P $ 是離散的(例如二項式參數的可能性)或反之亦然(例如具有單位速率參數但未指定形狀的 Erlang 分佈的可能性)
想像一個單一潛在觀察的雙變量函數 $ x $ (比如泊松計數)和單個參數(例如 $ \lambda $ ) – 在這個例子中是離散的 $ x $ 並持續在 $ \lambda $ – 那麼當你切片的二元函數時 $ (x,\lambda) $ 你得到的一種方式 $ p_\lambda(x) $ (每個切片給出不同的 pmf),當你以另一種方式切片時 $ \mathcal L_x(\lambda) $ (每個都有不同的似然函數)。
(那個二元函數只是表達了方式 $ x $ 和 $ \lambda $ 通過您的模型相關)
[或者,考慮一個離散的 $ \theta $ 和一個連續的 $ x $ ; 這裡的可能性是離散的,密度是連續的。]
只要您指定 $ x $ , 你確定一個特定的 $ \mathcal L $ ,我們稱之為樣本的似然函數。它告訴你關於 $ \theta $ 對於該樣本 - 特別是哪些值或多或少有可能給出該樣本。
可能性是一個告訴你相對機會的函數(因為可能性的比率可以被認為是在 $ x+dx $ )這個值 $ \theta $ 可以產生你的數據。