Conditional-Probability
為什麼密度函數有時用條件表示法編寫?
我一直看到密度函數不是由用條件符號編寫的條件明確產生的:例如對於高斯的密度 $ N(\mu,\sigma) $ 為什麼寫: $$ f(x| \mu, \sigma)=\frac{1}{\sqrt{2\pi \sigma^2}}\exp{-\frac{(x-\mu)^2}{2\sigma^2}} $$
代替
$$ f(x)=\frac{1}{\sqrt{2\pi \sigma^2}}\exp{-\frac{(x-\mu)^2}{2\sigma^2}} $$
這樣做純粹是為了明確參數值是什麼,或者(我希望)是否有與條件概率相關的含義?
- 在貝葉斯環境中,參數是隨機變量,因此在這種情況下,密度實際上是條件密度 $ X \mid (\mu, \sigma) $ . 在這種情況下,符號是非常自然的。
- 在貝葉斯上下文之外,這只是一種明確密度取決於參數的方法(這裡我是通俗地使用這個詞,而不是概率地使用這個詞)。有些人用 $ f_{\mu, \sigma}(x) $ 或者 $ f(x; \mu, \sigma) $ 達到同樣的效果。
- 後一點在似然函數的上下文中可能很重要。似然函數是參數的函數 $ \theta $ ,給定一些數據 $ x $ . 可能性有時寫為 $ L(\theta \mid x) $ 或者 $ L(\theta ; x) $ ,或者有時作為 $ L(\theta) $ 當數據 $ x $ 被理解為給出。令人困惑的是,在連續分佈的情況下,似然函數定義為參數對應的密度值 $ \theta $ , 在數據上評估 $ x $ , IE $ L(\theta; x) := f_\theta(x) $ . 寫作 $ L(\theta; x) = f(x) $ 會令人困惑,因為左側是 $ \theta $ ,而右側表面上似乎不依賴於 $ \theta $ . 雖然我更喜歡寫作 $ L(\theta; x) := f_\theta(x) $ , 有些人可能會寫 $ L(\theta; x) := f(x \mid \theta) $ .
- 我並沒有真正看到不同作者之間的符號一致性有多大,儘管如果我錯了,有人比我讀得更深,可以糾正我。