中年|进击的数据分析:像炒菜一样做策略( 二 )

  • 有些用户虽然资产不多 , 但人家平时诚实守信 , 后台记录显示借过的东西从来都按时交还并且没有损坏 。 对这类用户 , 每次还必须要交一次押金走一次审核 , 太不人性化 。
  • 你看 , 这就正好是我们开篇提到过的 , 单靠系统扩展性无法解决的复杂现实场景问题 , 需要靠策略出马 。
    中年|进击的数据分析:像炒菜一样做策略
    本文插图

    归纳上述问题 , 本质上就是一套模型打天下 , 没有对不同的用户进行分群处理 。 对一些资质高的用户、习惯好的用户 , 就应该建立绿色通道 。
    可如果在底层模型上改动 , 成本会比较大、周期会比较长 , 效果也不见得会很好 , 所以直接在策略层面动工解决问题 , 不失为一个思路 。

    如同前面的分析 , 对待政府官员这类用户 , 就应该有特殊人群这个划分;对待不同资质水平的用户 , 也应该有不同的细分;对待商家自己的员工 , 同样也要单独放行;对待过往履约记录比较好的用户 , 也应该给予奖励 。
    这些不同的用户群 , 都可以沉淀形成不同的白名单 , 以后模型遇见这些用户 , 就可以不同程度的开绿灯放行 , 减少不必要的麻烦 。
    中年|进击的数据分析:像炒菜一样做策略
    本文插图

    这套策略的原理其实不难 , 就像上面这个流程图一样 , 利用一些现成的底层模型组件组合一下就好 。
    比如用户资质分群、负面风控模型、场景履约模型等 , 就好比是炒菜——把现成的鸡肉、花生米、葱姜配合一些调料炒一炒 , 就能出来宫保鸡丁了 。
    中年|进击的数据分析:像炒菜一样做策略
    本文插图

    当生成了这些白名单之后 , 配合原有的风控模型和黑名单库 , 就可以让原有生涩不近人情的风控准入机制 , 变得“润滑”很多了 , 至少开篇提到的3个囧境大幅减少了 。
    三、实战案例2:精加工“食材”
    还有一种策略的设计 , 手头的食材种类不多 , 但需要从0到1做很多精加工才能成品 。 就好比手头只有一条鱼 , 要经过一些烹饪设计才能做出一道松鼠桂鱼来 。

    这里我用搜索场景举例 , 根据用户的一连串搜索关键词 , 判断出在用户眼中哪些品牌or产品之间是强竞争关系 。
    中年|进击的数据分析:像炒菜一样做策略
    本文插图

    上面这个散点图 , 是竞品分析的传统做法 。
    以汽车行业举例 , 右上角的那个奇骏就是广告主爸爸的儿子——本品 , 剩下的那些都是竞品 , 哪个离奇骏最近 , 哪个就是本品的最大竞品 。
    传统做法从相似度和争夺率这2个维度来拆解“竞争”这个概念 , 试图量化点与点之间的距离 。 但有问题 , 因为相似度和争夺率是这么计算的:
    • 相似度:在一段时间内 , 既搜过本品也搜过竞品的用户 , 在搜过本品或搜过竞品的总用户中的比例(本品与竞品的交集/本品与竞品的并集);
    • 争夺率:在一段时间内 , 搜索过本品的用户中 , 有多少人还搜索过某个竞品(本品与竞品的交集/本品) 。
    1. 问题一如果我事先不输入任何竞品 , 这个方法就行不通(相似度和争夺率的核心都是算交集 , 可你不告诉我跟谁交 , 我怎么算?) 。
    相当于它无法突破已知的经验范畴 , 而我们往往就是需要数据告知一些经验以外的东西 。
    2. 问题二这个方法中 , 只应用了“重合”这一个特征 。

    然而用户的搜索行为是一个连续的序列 , 是有前后顺序(先搜A再搜B和先搜B再搜A , 不一样)、有次数多寡(搜了10次A和只搜了1次A , 不一样)、有距离远近的(刚搜完A就搜B , 和搜完A之后又搜了CDE之再搜B , 不一样) , 这些信息在传统方法中 , 都没有体现出来 。


    推荐阅读