Regression

為什麼 beta 回歸不能處理響應變量中的 0 和 1?

  • February 17, 2017

Beta 回歸(即具有 Beta 分佈的 GLM,通常是 logit 鏈接函數)通常被推薦用於處理取值在 0 和 1 之間的響應(也稱為因變量),例如分數、比率或概率:結果的回歸(比率或分數)在 0 和 1 之間

但是,總是聲稱一旦響應變量至少一次等於 0 或 1,就不能使用 beta 回歸。如果是這樣,則需要使用零/一膨脹的 beta 模型,或者對響應進行一些轉換等:包括 1 和 0 的比例數據的 Beta 回歸

我的問題是:beta 分佈的哪個屬性阻止 beta 回歸處理精確的 0 和 1,為什麼?

我猜是這樣和不支持 beta 分發。但對於所有形狀參數和, 0 和 1支持 beta 分佈,只有較小的形狀參數,分佈在一側或兩側趨於無窮大。也許樣本數據是這樣的和提供最佳擬合結果都高於.

這是否意味著在某些情況下,即使使用零/一,實際上也可以使用 beta 回歸?

當然,即使 0 和 1 在 beta 分佈的支持下,恰好觀測到 0 或 1 的概率也為零。但是觀察任何其他給定的可數集的概率也是如此,所以這不是問題,不是嗎?(參見@Glen_b 的評論)。

貝塔分佈

在 beta 回歸的背景下,beta 分佈的參數化方式不同,但具有它仍然應該在對所有人.

在此處輸入圖像描述

因為對數似然同時包含和, 當或者. 參見 Smithson & Verkuilen 的方程 (4),“更好的檸檬榨汁機?具有 Beta 分佈因變量的最大似然回歸”(直接鏈接到PDF)。

引用自:https://stats.stackexchange.com/questions/262501

comments powered by Disqus