人工智能弘犀CRO黄又钢:小微贷款风控模型中的算法探索|CCF-GAIR 2020( 二 )
而在信用贷款行业中 , 我们需要关注它的四个维度:
一是风险程度 , 我要判断你这个人是否靠谱;二是给你放贷 , 我给你多少利息 , 价格是高是低;三是我给你多少钱 , 借你1000元、1万元还是300万元;四是期限 , 我是按天、按月计算还是按年计算?
在我国 , 中小微企业解决了国家80%的就业 , 这些企业的生存和贷款需求问题是需要持续关心和全力解决的 。
2006年 , 诺贝尔和平奖给了孟加拉国的经济学家 , 当时我在花旗银行 , 听到这个故事非常感动 。 经济学家真正去底层考察和生活 , 把27美元借给40多人 , 每人几毛钱、几美分地贷 , 这很难得 。
【人工智能弘犀CRO黄又钢:小微贷款风控模型中的算法探索|CCF-GAIR 2020】
当时花旗银行没有小微贷款 , 也没有普惠的概念 。 我直接找到我老板 , 我问他看和平奖了吗?他说看了 。 我问他花旗银行怎么没有普惠性的东西?他耸了耸肩 , 没搭理我 。 我问我们能否做这样的事情 , 他回答我“做好你的工作就行了 , 别管那么多闲事” 。
美国的银行在为富人服务 , 他们并不关心底下的中小企业 。 而在中国 , 国家真的会把钱倾斜到中小企业身上 。
机器学习算法概述
机器学习是AI的分支 , 现在机器学习有非常成熟的算法 。 我很喜欢这个图片 , 虽然这张并不是最新的图片 。
本文插图
它列出的算法比较规范、有条理性 。 深度学习、集成算法、神经网络、正则化算法、规则算法、回归算法、贝叶斯算法、决策树算法、降维算法、实例算法、聚类算法 , 这些算法十几年前就有了 , 有些仍在不断更新 。
如果一个人想做机器学习 , 至少要懂每个算法的原理 , 这些算法背后的逻辑是什么?其底层数据是怎么回事?
我今天主要介绍集成算法、降维算法、聚类算法和决策树算法 。 每个算法都有实实在在的应用和意义 , 不是为了算法而算法 。
如何应用算法?我们现在做任何模型一定是两个算法同时进行 , 既要做传统模型回归算法 , 也要做机器学习算法 。 传统模型主要指的是回归算法(LR) , 取决于应用场景 。 机器学习模型 , 我们主要指的是XGB , 集成随机树的算法 。
本文插图
经典风控领域全都是以回归模型为主导 。 原因在于其稳定性好 , 可解释性非常强 。
在美国 , 机器学习在任何信贷场景都不能落地 , 也不能使用 , 原因在于我们无法解释底层拒绝贷款申请的原因是什么 。 由于不能解释 , 在美国的法规下就不能应用 。 所以机器学习只能在底层 , 我们分析团队、模型团队可以高大上地玩 , 但只能玩而已 , 真正实战一律不许用 。
在中国 , 我们不仅玩 , 还有机会可以使用 。 至少从法规层面 , 我们还没有严格要求拒绝一个贷款必须跟企业或者客户解释理由 。
实操“双轨”建模有几大过程:一是预测能力的比较; 二是变量维度的判断;三是对比同一个观测值 , 如何交叉使用;四是策略应用 , 即如何使用这个模型 。
如何使用这两个模型?我们可以将数据集分为两类(路径):一类是传统模型 , 另一类是机器学习模型 。
本文插图
建完模型一定要有预测能力 , 假如用KS表述模型的准确率 , 你可以通过ROC、AUC等统计控制 。
假如我们用(统计)变量(做评估) , 不管(使用)哪个统计变量一定有好坏的比较 。 机器学习好或者不好的比较 , 首先是评测模型的层面 。
有了模型层面的比较后 , (谈)模型一定会牵扯具体的特征值或者变量 。
推荐阅读
- 央视新闻客户端|直通服贸会|服贸会上的“科技范儿”人工智能服务
- 【】服贸会上的“科技范儿”人工智能服务
- 直通服贸会|服贸会上的“科技范儿”人工智能服务
- 草莓味的棉花糖|陈根:当人工智能与猜拳狭路相逢,石头剪刀布还随机吗?
- |知名女星前男友被限制高消费
- 行业互联网|“朝阳20强”发布,以人工智能、大数据企业为主
- 孤惯|通用人工智能啥时候能实现?这是我的最新预测
- 爱集微|投向智能制造/人工智能等领域,欣旺达子公司参与设立产业基金
- 央视财经|技术创新赋予服务贸易新动能!百度首席技术官:人工智能是重要一环→
- 电子发烧友|人工智能将助力中国经济实现高质量发展
