中年|进击的数据分析：像炒菜一样做策略( 二 ) |策略|进击|

有些用户虽然资产不多，但人家平时诚实守信，后台记录显示借过的东西从来都按时交还并且没有损坏。对这类用户，每次还必须要交一次押金走一次审核，太不人性化。

你看，这就正好是我们开篇提到过的，单靠系统扩展性无法解决的复杂现实场景问题，需要靠策略出马。

本文插图

归纳上述问题，本质上就是一套模型打天下，没有对不同的用户进行分群处理。对一些资质高的用户、习惯好的用户，就应该建立绿色通道。
可如果在底层模型上改动，成本会比较大、周期会比较长，效果也不见得会很好，所以直接在策略层面动工解决问题，不失为一个思路。

如同前面的分析，对待政府官员这类用户，就应该有特殊人群这个划分；对待不同资质水平的用户，也应该有不同的细分；对待商家自己的员工，同样也要单独放行；对待过往履约记录比较好的用户，也应该给予奖励。
这些不同的用户群，都可以沉淀形成不同的白名单，以后模型遇见这些用户，就可以不同程度的开绿灯放行，减少不必要的麻烦。

本文插图

这套策略的原理其实不难，就像上面这个流程图一样，利用一些现成的底层模型组件组合一下就好。
比如用户资质分群、负面风控模型、场景履约模型等，就好比是炒菜——把现成的鸡肉、花生米、葱姜配合一些调料炒一炒，就能出来宫保鸡丁了。

本文插图

当生成了这些白名单之后，配合原有的风控模型和黑名单库，就可以让原有生涩不近人情的风控准入机制，变得“润滑”很多了，至少开篇提到的3个囧境大幅减少了。
三、实战案例2：精加工“食材”
还有一种策略的设计，手头的食材种类不多，但需要从0到1做很多精加工才能成品。就好比手头只有一条鱼，要经过一些烹饪设计才能做出一道松鼠桂鱼来。

这里我用搜索场景举例，根据用户的一连串搜索关键词，判断出在用户眼中哪些品牌or产品之间是强竞争关系。

本文插图

上面这个散点图，是竞品分析的传统做法。
以汽车行业举例，右上角的那个奇骏就是广告主爸爸的儿子——本品，剩下的那些都是竞品，哪个离奇骏最近，哪个就是本品的最大竞品。
传统做法从相似度和争夺率这2个维度来拆解“竞争”这个概念，试图量化点与点之间的距离。但有问题，因为相似度和争夺率是这么计算的：

相似度：在一段时间内，既搜过本品也搜过竞品的用户，在搜过本品或搜过竞品的总用户中的比例（本品与竞品的交集/本品与竞品的并集）；
争夺率：在一段时间内，搜索过本品的用户中，有多少人还搜索过某个竞品（本品与竞品的交集/本品）。

1. 问题一如果我事先不输入任何竞品，这个方法就行不通（相似度和争夺率的核心都是算交集，可你不告诉我跟谁交，我怎么算？）。
相当于它无法突破已知的经验范畴，而我们往往就是需要数据告知一些经验以外的东西。
2. 问题二这个方法中，只应用了“重合”这一个特征。

然而用户的搜索行为是一个连续的序列，是有前后顺序（先搜A再搜B和先搜B再搜A ，不一样）、有次数多寡（搜了10次A和只搜了1次A ，不一样）、有距离远近的（刚搜完A就搜B ，和搜完A之后又搜了CDE之再搜B ，不一样），这些信息在传统方法中，都没有体现出来。