你担心的金融安全 无监督机器学习技术可以搞定( 三 )

“无监督机器学习是近年才发展起来的反欺诈手法 。 目前国内反欺诈金融服务主要是应用黑白名单、有监督学习和无监督机器学习的方法来实现 。 ”爱信诺征信有限公司总经理金端峰在接受科技日报采访人员专访时说 。

黑白名单被认为是最原始的反欺诈方式 , 类似于“筛选器” 。 如银行征信系统就可理解成一个黑白名单 , 信用卡多次逾期还款就可能被列入信贷“黑名单”;在淘宝上购买了退货险后屡屡退货 , 就可能上骗保“黑名单” 。 黑白名单是所有反欺诈方法中最简单的 , 但也是更新最慢、成本最高的 。

能将异常用户一网打尽

有监督学习需要大量有标签数据来训练模型 , 以此来预测还未被标注的数据 。 以垃圾邮件为例 , 假如把5000封已由人工确认过的垃圾邮件输入到模型 , 模型通过对标题的识别、邮件内容句子的分割、关键词的识别等各种分析方法 , 找到其中的内在关系 。 如标题中有“福利”二字的 , 有90%的可能性是垃圾邮件;一次性发送超过200封的 , 有60%的可能性是垃圾邮件;回复率低于10%的 , 有70%的可能性是垃圾邮件……于是 , 当模型处理一封新邮件时 , 通过检测以上各子项 , 并对每一子项乘以百分比后相加 , 就能得出垃圾邮件的可能性 。 但有监督学习的弊端是 , 每个模型都需要大量训练数据以及较长的训练时间 。


推荐阅读