什麼是“拒絕推理”以及如何使用它來提高模型的準確性?
誰能詳細解釋一下:
- 拒絕推理是什麼意思?
- 如何使用它來提高我的模型的準確性?
我確實有在信用卡申請中拒絕推理的想法,但在考慮使用它來提高我的模型的準確性時遇到了困難。
在信用模型構建中,拒絕推斷是推斷在申請過程中被拒絕的信用賬戶的表現的過程。
在建立應用信用風險模型時,我們希望建立一個具有“透支性**”適用性的模型,即將應用數據全部輸入信用風險模型,模型輸出風險等級或概率默認的。使用回歸從過去的數據構建模型時的問題是,我們只知道過去接受的應用程序的帳戶性能。但是,我們不知道拒絕的表現,因為在申請後我們將它們送回了門外。這可能會導致我們的模型出現選擇偏差**,因為如果我們只在模型中使用過去的“接受”,該模型可能不會在“通過門”人群中表現良好。
有很多方法可以處理拒絕推理,所有這些方法都存在爭議。我將在這裡提到兩個簡單的。
- “將過去的拒絕定義為不良”
- 打包
“將過去的拒絕定義為不良”只是獲取所有被拒絕的應用程序數據,而不是在構建模型時將其丟棄,而是將它們全部分配為不良數據。這種方法使模型嚴重偏向過去的接受/拒絕策略。
“包裹”稍微複雜一點。它包括
- 用過去的“接受”建立回歸模型
- 將模型應用於過去的拒絕,為它們分配風險評級
- 使用每個風險評級的預期違約概率,將被拒絕的申請分配為好或壞。例如,如果風險評級有 10% 的違約概率,並且有 100 個被拒絕的申請屬於該風險評級,則將 10 個拒絕分配給“壞”,將 90 個拒絕分配給“好”。
- 使用接受的應用程序重建回歸模型,現在使用被拒絕應用程序的推斷性能
在步驟 3 中有不同的方法來分配好或壞,這個過程也可以迭代應用。
如前所述,拒絕推理的使用是有爭議的,很難直接回答如何使用它來提高模型的準確性。在這個問題上,我將簡單地引用其他一些人的話。
Jonathan Crook 和 John Banasik,拒絕推理真的能提高應用評分模型的性能嗎?
首先,即使在很大比例的申請人被拒絕的情況下,僅對那些被接受的人進行參數化的模型的改進空間似乎也很小。在拒絕率不是很大的地方,這個範圍似乎確實很小。
David Hand,“信用操作中的直接推理”,出現在信用評分手冊中,2001 年
已經提出並使用了幾種方法,雖然其中一些方法顯然很差,不應該推薦,但除非獲得額外的信息,否則沒有唯一的普遍適用的最佳方法。也就是說,最好的解決方案是獲取更多關於那些落入拒絕區域的申請人的信息(也許通過向一些潛在的拒絕提供貸款)。