Mathematical-Statistics
外行術語的最大似然估計 (MLE)
誰能用外行的術語向我詳細解釋最大似然估計(MLE)?在進入數學推導或方程之前,我想知道基本概念。
假設你有一些數據。假設您願意假設數據來自某種分佈——也許是高斯分佈。數據可能來自無數個不同的高斯分佈(對應於高斯分佈可以具有的無數個均值和方差的組合)。MLE 將選擇與您的數據“最一致”的高斯(即均值和方差)(一致的確切含義如下所述)。
所以,假設你有一個數據集 $ y = {-1, 3, 7} $ . 數據可能來自的最一致的高斯分佈的平均值為 3,方差為 16。它可能是從其他一些高斯分佈中採樣的。但是一個平均值為 3,方差為 16 的數據在以下意義上與數據最一致:得到特定值的概率 $ y $ 選擇這種均值和方差時,您觀察到的值比任何其他選擇都大。
轉向回歸:平均值不是常數,而是數據的線性函數,由回歸方程指定。所以,假設你有這樣的數據 $ x = { 2,4,10 } $ 隨著 $ y $ 從以前。該高斯的平均值現在是擬合回歸模型 $ X'\hat\beta $ , 在哪裡 $ \hat\beta =[-1.9,.9] $
轉向 GLM:用其他分佈(來自指數族)替換高斯分佈。平均值現在是數據的線性函數,由回歸方程指定,由鏈接函數轉換。所以就是 $ g(X'\beta) $ , 在哪裡 $ g(x) = e^x/(1+e^x) $ 對於 logit(使用二項式數據)。