Logistic

Cox 模型與邏輯回歸

  • April 4, 2013

假設我們遇到了以下問題:

預測未來 3 個月內哪些客戶最有可能停止在我們的商店購買。

對於每個客戶,我們知道他們開始在我們的商店購買的月份,此外,我們在每月匯總中還有許多行為特徵。“最年長”的客戶已經購買了 50 個月;讓我們表示自客戶開始購買以來的時間()。可以假設客戶端的數量非常大。如果客戶停止購買三個月然後回來,那麼他將被視為新客戶,因此事件(停止購買)只能發生一次。

我想到了兩個解決方案:

邏輯回歸- 對於每個客戶和每個月(可能是最近的 3 個月除外),我們可以判斷客戶是否停止購買,因此我們可以對每個客戶和每個月進行一次觀察來做滾動樣本。我們可以使用自開始以來的月數作為分類變量來獲得一些等價的基本風險函數。

擴展的 Cox 模型- 這個問題也可以使用擴展的 Cox 模型來建模。看來這個問題更適合生存分析。

**問題:**生存分析在類似問題中的優勢是什麼?生存分析是出於某種原因發明的,所以一定有一些嚴重的優勢。

我在生存分析方面的知識不是很深,我認為 Cox 模型的大多數潛在優勢也可以使用邏輯回歸來實現。

  • 可以使用以下相互作用獲得分層 Cox 模型的等價物和分層變量。
  • 交互 Cox 模型可以通過將種群劃分為幾個子種群並估計每個子種群的 LR 來獲得。

我看到的唯一優勢是 Cox 模型更靈活;例如,我們可以很容易地計算出客戶在 6 個月內停止購買的概率。

Cox 模型的問題在於它無法預測任何東西。Cox 模型中的“截距”(基線風險函數)從未被實際估計過。邏輯回歸可用於預測某些事件的風險或概率,在這種情況下:受試者是否在特定月份進來購買東西。

普通邏輯回歸背後假設的問題在於,您將每個人月的觀察視為獨立的,無論它是同一個人還是發生觀察的同一個月。這可能很危險,因為有些物品是在兩個月的間隔內購買的,因此連續的逐月觀察是相關的。或者,客戶可以通過連續的人的好或壞經歷來保留或失去,按月觀察呈相關。

我認為這個預測問題的一個良好開端是採用預測方法,我們可以使用以前的信息來為我們預測下個月的業務提供信息。這個問題的一個簡單開始是調整滯後效應,或者一個指標是否在上個月到達*,作為他們**本月*是否可能到達的預測指標。

引用自:https://stats.stackexchange.com/questions/55118

comments powered by Disqus