产业气象站|新网银行刘波:不必神话大数据风控

文章图片
凡事过犹不及 , 当整个市场都在谈论大数据风控 , 都在吹捧机器学习时 , 危机已经悄然而至 。
不仅是金融科技公司在谈 , 互联网巨头在谈 , 整个银行圈也在谈 。
城商行、农商行觉得这是弯道超车的机会 , 国有大行害怕错失新技术的窗口 , 金融科技公司对谁都在鼓吹 。
尤其在疫情发生后 , 金融业的无接触服务从之前的可选项一下子变成了必选项 , 出门不谈点大数据 , 都不好意思见人 。
疫情期间 , 我在线听了不少金融科技公司专家的论坛发言 , 不少人有真才实学 , 让我和自己的从业经验交相印证 , 获益良多 。 但更多人的观点和方法论让我越听越心惊 , 而这些发言者中 , 很多已经是金融科技上市公司的高管 , 他们服务的银行非常多 , 这让我不禁深深的担忧 。
银行部分业务朝线上化转型当然是方向 , 科学的数据化决策当然是很好的路径 , 但贩卖焦虑 , 甚至神话大数据风控 , 大可不必 。
我的职业生涯 , 在阿里参与了中国第一家互联网小贷的建设 , 在蚂蚁第一次筹建互联网银行并管理它的主要业务 , 到新网银行第二次筹建互联网银行并分管所有资产业务、账户和存款理财 , 我的整个职业生涯都与互联网、大数据、金融这几个关键词相伴 。
我当然不排斥大数据风控 , 从我的从业经历可以看出 , 我是它最早的尝试者和推动者之一 。
我一直在行业一线 , 细数一下 , 这些年从我直接管理部门发放的全在线小微贷款超过了1万亿元(不含联合贷) , 消费信贷超过了4000亿元(含联合贷) 。 但今天 , 我发现自己已经听不懂这个市场上的某些专家在说些什么 。
金融业务的风险决策 , 是一个数学问题 , 但绝不仅仅是一个数学问题 。 决策树、朴素贝叶斯分类、支持向量机、逻辑回归、线性回归、随机森林……这些算法是工具 , 是方法 , 但不能也不应该是决策的全部 。
我看到很多的风控团队 , 有些甚至是国内一线公司的风控团队 , 清一色数学、统计学高学历技术专家 , 基本就是在电脑前研究算法 , 研究数据 。 他们给出的每一个判断 , 都有详细的数据支撑 , 他们每一次调整 , 都貌似接近当下最优解 。
你很难挑战他们 , 因为他们掌握数据 , 你个人的经验又怎么能挑战动辄几百万的数据样本呢?
但很多人不了解 , 同样的数据 , 解读是具备多角度的 。 由于数据本身具备复杂关联性 , 数据呈现的背后又有更多的原因 , 数据本身就会“骗人” 。 看似对 , 有时候要比明显的错危害大得多 。
科学的决策 , 不但需要适合的工具 , 还需要深刻了解你的业务场景 , 深刻了解你的客户 , 算法是为了决策服务 , 而不应该成为决策本身 。
这么说太抽象 , 举一些例子吧 。
主流银行(我不喜欢用传统银行这个词 , 主流银行更为准确)信贷风险控制 , 最看重两点:一是贷前审批控制违约概率(PD) , 二是贷后处置降低违约损失率(LGD) 。
为了控制违约概率 , 必然要求客户提供多项资料去证明有能力有意愿归还贷款 , 银行流水、收入证明、社保公积金、房产证、车辆行驶证都是为了证明这件事——我不一定让你抵押 , 但你需要证明你有哪些 。
公务员、企事业单位、银行从业人员、知名企业的员工更容易获得贷款 , 无它 , 认为你收入稳定 , 违约成本高 , 违约概率低 。
降低违约损失率的方法也很简单 , 就是寻找优质抵押品 , 由于中国的房价在去年以前稳定的上涨了二十年 , 在过去二十年里 , 房产抵押是最为吃香及稳妥的抵押物 , 其次就是汽车 。 这二十年里 , 银行做零售贷款很粗放但很有效 , 房屋按揭贷款几乎是银行零售贷款的全部 。
我并不觉得复杂模型算法比这些简单直接的方法更高明 , 控制风险更有效 。 简单说 , 要是能方便的获取到这些核心信息 , 很多时候没有必要获取客户各种行为数据 , 做复杂的风险相关性分析 。
数据是有成本的 , 数据的获取是需要客户授权的 。 如果一个客户几十K核心数据就能决策 , 干嘛非要分析上百兆的数据呢?
单户上百兆数据 , 为了节省成本 , 还得研制复杂的数据路由规则 , 让单户数据成本可控 。
这么多数据标签要进入模型 , 得考虑缺失度容忍问题 , 否则模型运转不起来 , 运转起来效果可能也不好 , 这就需要一套复杂算法 。
另外 , 还要考虑数据源的可替代性 , 否则一旦某个关键数据源出现问题 , 就是大瘫痪 , 这又是一整套复杂工程 。
所以说 , 复杂并不代表先进 , 简单并不代表不好 , 关键是匹配你的业务 , 匹配你能掌握的资源 。
大数据风控很好 , 但过度的吹 , 就变成了黑 。
谈了主流银行 , 也要谈谈我心目中比较适配的大数据风控是什么样的 。 真正好的大数据风控 , 应该是充分利用你所匹配的资源 , 有一条清晰的风控逻辑主线 。
不来虚的 , 直接上干货 。
花呗产品设计之初 , 它的风控充分利用阿里巴巴、蚂蚁的海量交易数据 , 它的底层逻辑是马斯洛需求理论:生理的需要 , 安全的需要 , 情感的需要 , 尊重的需要 , 自我实现的需要 。
推荐阅读
- 中新网|长江上中游水库群作用明显 流域防洪风险整体可控
- 中新网|新疆兵团市场监管部门严查涉“疫”价格违法违规行为
- 中新网|国家全面推进一件大事,你的小区房子可能要升值!
- 青年|汕头华侨试验区探索以人工智能、5G赋能产业转型升级
- 生态环境|凉山创新网格化生态环境监管机制实现和政法委网格化管理联动
- 大众报业·海报新闻|汽车产业捱寒冬 新能源汽车几家欢喜几家愁
- 中新网|广州多家电影院复工 观众观影全程戴口罩
- 中新网|古DNA研究:亚洲和欧洲人群至少在4万年前已经分离
- 硅片|千亿半导体巨头蓄势待发,沪硅产业引领硅片国产化进入快车道|面对面
- 青年|西安邮电大学与安康汉滨区深度合作,研发适合毛绒玩具全产业链实用技术
