Modeling

在員工流失模型的背景下,提升和增益圖說明了什麼

  • July 27, 2012

因此,我試圖進一步了解提升和增益圖表,因為它適用於我的員工流動模型(即在 SPSS Modeler 中使用 CHAID)。對於我的數據,這意味著預測自願離開公司的人數。

我已經查看了以下參考資料並了解了有關解釋的基礎知識:x 和 y 軸上繪製的內容以及您正在尋找的理想曲線。我什至練習在 Excel 中構建自己的收益和提升圖表。

但到目前為止,我看到的所有例子都是針對直郵活動的。現在我想知道這對我的數據意味著什麼。這是否僅僅意味著,在增益圖表的情況下,如果我對前 10% 的數據進行抽樣,我可以預期 40% 的術語,而對前 60% 的數據進行抽樣得到 80% 的術語?(請假設 40% 和 60% 是值)。如果是這樣,那麼我應該從中刪除什麼意義,因為我真的沒有在我的營業額模型的背景下得到它?

參考:

數據挖掘中的提升測量

什麼是電梯圖表

http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html

有時它有助於描繪這種分析的目標以及公司在沒有它的情況下可以做什麼。假設營業額數據所屬的公司想要針對(可能)高流動率採取措施。我可以想像兩種可能的行動

  1. 找出是什麼驅使人們離開並解決這個問題(沒有足夠的醫療保健?沒有團隊精神?
  2. 找到正在考慮離開的員工並與他們交談,找出是什麼促使他們專門為他們解決問題。

那麼這有什麼關係呢?

提升圖對於第二個用例非常重要。想像一下,當一家公司決定投資時與員工一對一交談但沒有模型時,他們會做什麼?唯一的選擇是與每個人交談,或者在固定大小**的隨機樣本中與每個人交談。**與所有人交談,儘管可以識別所有潛在的離職人員,但成本太高了。但是,當只選擇一個隨機樣本與之交談時,只有一小部分潛在離職者被識別出來,同時仍然花費大量資金。在這兩種情況下,每次休假預防成本比率都很高。

但是當存在一個好的模型時,公司可以決定只與那些最有可能離開的人(根據模型得分最高的人)交談,從而識別出更多的潛在離職者,從而優化每人成本-請假預防

再看看這裡的前兩個表:http ://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html 。假設“客戶”=“員工”和“積極的受訪者”=“潛在離職者”(請參閱下面的數據)。

如果公司決定只能花足夠的錢與 10000 名員工交談,它將確定

  • 沒有模型識別離開者
  • 離開者模型標識(根據模型分數只選擇前10000)

意思是

  • 因子的改進如圖所示為提升圖中的點 (10%,3) 。
  • 20000 總離職者中有 6000 人已確定,即 30%,在增益圖中如圖所示為 (10%,30%) 。這裡的基線只有 10%,因為通過對 10000 名員工進行隨機抽樣,只有確定了所有潛在的離職人員。

兩種情況下的 x 軸都顯示了已聯繫員工的百分比,在此具體示例中為 10%。

附錄

用於使這個問題獨立於鏈接腐爛的數據。

總價

與已確定離職人員聯繫的員工總數
100000 20000

以 10000 人為單位聯繫員工時模型的有效性

與已確定離職人員聯繫的員工總數
10000 6000
20000 10000
30000 13000
40000 15800
50000 17000
60000 18000
70000 18800
80000 19400
90000 19800
100000 20000

引用自:https://stats.stackexchange.com/questions/33148

comments powered by Disqus