Logistic

什麼是“拒絕推理”以及如何使用它來提高模型的準確性?

  • July 27, 2011

誰能詳細解釋一下:

  1. 拒絕推理是什麼意思?
  2. 如何使用它來提高我的模型的準確性?

我確實有在信用卡申請中拒絕推理的想法,但在考慮使用它來提高我的模型的準確性時遇到了困難。

在信用模型構建中,拒絕推斷是推斷在申請過程中被拒絕的信用賬戶的表現的過程。

在建立應用信用風險模型時,我們希望建立一個具有“透支性**”適用性的模型,即將應用數據全部輸入信用風險模型,模型輸出風險等級或概率默認的。使用回歸從過去的數據構建模型時的問題是,我們只知道過去接受的應用程序的帳戶性能。但是,我們不知道拒絕的表現,因為在申請後我們將它們送回了門外。這可能會導致我們的模型出現選擇偏差**,因為如果我們只在模型中使用過去的“接受”,該模型可能不會在“通過門”人群中表現良好。

有很多方法可以處理拒絕推理,所有這些方法都存在爭議。我將在這裡提到兩個簡單的。

  • “將過去的拒絕定義為不良”
  • 打包

“將過去的拒絕定義為不良”只是獲取所有被拒絕的應用程序數據,而不是在構建模型時將其丟棄,而是將它們全部分配為不良數據。這種方法使模型嚴重偏向過去的接受/拒絕策略。

“包裹”稍微複雜一點。它包括

  1. 用過去的“接受”建立回歸模型
  2. 將模型應用於過去的拒絕,為它們分配風險評級
  3. 使用每個風險評級的預期違約概率,將被拒絕的申請分配為好或壞。例如,如果風險評級有 10% 的違約概率,並且有 100 個被拒絕的申請屬於該風險評級,則將 10 個拒絕分配給“壞”,將 90 個拒絕分配給“好”。
  4. 使用接受的應用程序重建回歸模型,現在使用被拒絕應用程序的推斷性能

在步驟 3 中有不同的方法來分配好或壞,這個過程也可以迭代應用。

如前所述,拒絕推理的使用是有爭議的,很難直接回答如何使用它來提高模型的準確性。在這個問題上,我將簡單地引用其他一些人的話。

Jonathan Crook 和 John Banasik,拒絕推理真的能提高應用評分模型的性能嗎?

首先,即使在很大比例的申請人被拒絕的情況下,僅對那些被接受的人進行參數化的模型的改進空間似乎也很小。在拒絕率不是很大的地方,這個範圍似乎確實很小。

David Hand,“信用操作中的直接推理”,出現在信用評分手冊中,2001 年

已經提出並使用了幾種方法,雖然其中一些方法顯然很差,不應該推薦,但除非獲得額外的信息,否則沒有唯一的普遍適用的最佳方法。也就是說,最好的解決方案是獲取更多關於那些落入拒絕區域的申請人的信息(也許通過向一些潛在的拒絕提供貸款)。

引用自:https://stats.stackexchange.com/questions/13533

comments powered by Disqus

相關問答