Estimation

指數模型的估計

  • January 30, 2011

指數模型是由以下等式描述的模型:

用於估計此類模型的最常用方法是線性化,這可以通過計算兩邊的對數來輕鬆完成。其他方法是什麼?我對那些可以處理的特別感興趣在一些觀察中。

更新 31.01.2011

我知道這個模型不能產生零。我將詳細說明我正在建模的內容以及我選擇此模型的原因。假設我們想預測客戶在商店里花了多少錢。當然很多客戶只是在看,他們什麼都不買,這就是為什麼有 0。我不想使用線性模型,因為它會產生很多負值,這沒有任何意義。另一個原因是這個模型效果很好,比線性模型好得多。我已經使用遺傳算法來估計這些參數,所以這不是“科學”的方法。現在我想知道如何用更科學的方法來處理問題。還可以假設大多數甚至所有變量都是二進制變量。

這裡有幾個問題。

(1)模型需要明確的概率。在幾乎所有情況下,都不會有lhs與所有數據的 rhs 匹配的參數集:會有殘差。您需要對這些殘差做出假設。您是否希望它們平均為零?對稱分佈?近似正態分佈?

這裡有兩個模型與指定的模型一致,但允許完全不同的殘差行為(因此通常會導致不同的參數估計)。您可以通過改變關於聯合分佈的假設來改變這些模型:

(請注意,這些是數據模型 ; 通常沒有估計數據值這樣的東西.)

(2) 需要處理 y 的零值意味著所述模型 (A) 既錯誤又不充分,因為無論隨機誤差等於多少,它都無法產生零值。上面的第二個模型 (B) 允許 y 的值為零(甚至為負)。但是,不應僅根據這樣的基礎來選擇模型。重申#1:合理地對錯誤建模很重要。

(3)線性化改變模型。通常,它會產生像 (A) 但不像 (B) 的模型。對數據進行了足夠分析以知道這種變化不會明顯影響參數估計的人以及對正在發生的事情一無所知的人使用它。(很多時候很難區分。)

(4)處理零值可能性的常用方法是提出(或其某些重新表達,例如平方根)具有同樣為零的嚴格正概率。在數學上,我們將點質量(“delta 函數”)與其他分佈混合在一起。這些模型如下所示:

在哪裡是向量中隱含的參數之一,是一些分佈族參數化, 和是的重新表達的(廣義線性模型的“鏈接”功能:參見 onestop 的回复)。(當然,那麼,=什麼時候.) 例子是零膨脹泊松模型和負二項式模型

(5)構建模型和擬合模型的問題是相關的,但又是不同的。舉個簡單的例子,即使是普通的回歸模型可以通過最小二乘(給出與最大似然相同的參數估計和幾乎相同的標準誤差)、迭代重新加權最小二乘、各種其他形式的“穩健最小二乘”等方式進行擬合。通常基於便利性、權宜性(例如,軟件的可用性)、熟悉度、習慣或約定,但至少應該考慮一下什麼是適合錯誤項的假設分佈的,問題的損失函數可能是合理的,以及利用額外信息的可能性(例如參數的先驗分佈)。

引用自:https://stats.stackexchange.com/questions/6720

comments powered by Disqus