典型的信用评分模型如图1-1所示,本图来源于“智能风控:原理、算法与工程实践”一书,信用风险评级模型的主要开发流程如下:

1. 业务需求:信用风险、欺诈风险
2. 抽象数学问题:回归、分类
3. 数据准备:数据多来自数据仓库、业务数据库、CSV等
4. 探索性数据分析:该步骤主要是获取样本总体的大概情况,描述样本总体情况的指标主要有直方图、箱形图等。
5. 数据预处理:主要工作包括数据清洗、缺失值处理、异常值处理
6. 特征工程:该步骤主要是通过统计学的方法,筛选出对违约状态影响最显著的指标,主要有单变量特征选择方法和基于机器学习模型的方法 。
7. 模型开发:该步骤主要包括变量分段、变量的WOE(证据权重)变换和逻辑回归估算三部分。
8. 模型评价:该步骤主要是评估模型的区分能力、预测能力、稳定性,并形成模型评估报告,得出模型是否可以使用的结论。
9. 信用评分转换:根据逻辑回归的系数和WOE等确定信用评分的方法。将Logistic模型转换为标准评分的形式。
10. 建立评分系统,根据信用评分方法,建立自动信用评分系统。
根据模型实际应用效果反馈,2-10需要不停迭代。
某AI平台可视化建模展示:

评分卡模型主要有以下几个概念:
什么是评分卡(信贷场景中)
以分数的形式来衡量风险几率的一种手段,对未来一段时间内违约/逾期/失联概率的预测。通常评分越高越安全。根据使用场景分为反欺诈评分卡、申请评分卡、行为评分卡、催收评分卡。
为什么要开发评分卡
风险控制的一个环节,根据已有数据提供逾期概率指标参考。
评分卡的特性
- 稳定性预测能力等价于逾期概率
- 以分数的形式来衡量,这个分数主要根据客户的好坏比来确定;是对未来一段时间内违约/逾期/失联概率的预测有一个明确的正区间。通常分数越高越安全。数据驱动。
主要的评分卡模型在互联网金融方面的表现形式是:申请评分卡、反欺诈评分卡、行为评分卡、催收评分卡。其中申请评分卡、反欺诈评分卡使用在申请环节,行为评分卡使用在监控环节,催收评分卡使用在逾期管理环节。
评分卡开发的常用模型
逻辑回归、决策树等。本文重点介绍申请评分卡暨A卡的实现逻辑。
一、数据准备
数据来自Kaggle的Give Me Some Credit,有15万条的样本数据。数据属于个人消费类贷款,只考虑信用评分最终实施时能够使用到的数据应从如下一些方面获取数据:
- 基本属性:包括了借款人当时的年龄。
- 偿债能力:包括了借款人的月收入、负债比率。
- 信用往来:两年内35-59天逾期次数、两年内60-89天逾期次数、两年内90天或高于90天逾期的次数。
- 财产状况:包括了开放式信贷和贷款数量、不动产贷款或额度数量。
- 贷款属性:暂无。
- 其他因素:包括了借款人的家属数量(不包括本人在内)。
- 时间窗口:自变量的观察窗口为过去两年,因变量表现窗口为未来两年。
© 版权声明
本网站上的所有资源均来源于本网站,所有网址和文章版权均归原作者所有。如有侵权行为,请将相关证明发送至以下电子邮件地址:dxsen@qq.com