企业从瑞幸咖啡事件看如何尽调互联网企业( 四 )


通过多维度数据间的内在联系来准确描绘出客户行为 , 例如多维度数据的匹配(订单流量、资金流水、物流的匹配) , 在分析指标类数据的趋势和异常情景的同时 , 利用数据分析模型及算法 , 从多维度进行异常数据判断 。
对业务指标多维度交叉分析:结合线上推广时间轴与数据出现的时间节点进行匹配 , 判断是否符合正常的商业逻辑、关注线上购买后的使用效率、用户和交易的集中度、支付流水与订单的匹配、交易时间及额度的合理性;通过编造系统数据或系统日志来提升业务指标的 , 在数据验证中仅需要逻辑场景验证即可识别出这类造假行为 。
因为此类数据虚构完全通过IT手段完成 , 没有任何实际业务的支撑 , 而且由于没有开展实际运营 , 虚假数据与真实数据缺少整体的逻辑关系 。
异常情景分析例如:再销售端发现发货或退货比例过高 , 单个的客户下单频次过高 , 下单的时间不在消费集中时点区间等 。 在互联网零售的领域里 , 由于SKU众多且分布呈现长尾特征 , 企业通常会通过低毛利和高毛利的商品组合来调整 , 以低毛利的SKU获得客源 , 再以高毛利的SKU来提升盈利水平 , 但由于企业依赖低毛利的SKU吸引客户持续购买 , 导致其销售策略很难推进 。
另外尽调过程中的异常信号还包括:异常资本支出 , 如超过正常标准的装修费用、设备投入等 。 异常获客、广告费用开支;商业实质存疑的并购 / 投资行为;识别单个设备是否有多个关联账号 , 单个用户是否存在重复购买或大额购买的情况、根据用户及订单分布进一步分析异常数据 。 如果发现有大量的点击量但成功转化的很少要警觉是否流量作弊 。
预测假设的合理性也是尽调中必不可少的一部分 , 有些互联网企业为了做高估值设定了夸张的收入增长假设 , 以及低于合理范围的费用假设等 。 尽调时 , 可以首先从企业历史的经营数据中推算出合理的增长 , 再去验证企业未来的订单收入增长是否符合逻辑 。 此外 , 根据企业历史费用与收入的占比 , 推算出企业的未来的费用是否合理的支撑了未来的收入增长 。
此外 , 在对企业运营数据的真实行及合理性尽调时 , 利用IT、大数据、人工智能等分析也是重要的方法 。 人工智能算法会根据目标业务的具体运营方式与所提供的数据内容 , 选用相对应的机器学习算法或数据分析模型 , 结合对非标准数据的处理能力对数据进行深度挖掘分析 , 从而定位出目标业务数据中潜在的造假风险;运用大数据可以识别出电商平台中存在的刷单情况 , 甚至能够估算出涉及金额所占比例和虚高的数据范围 。 其他还有:
CAAT , 即计算机辅助审计技术 , 可以利用计算机和相关软件对报告数据的准确性进行测试 , 从而提高了审阅大量交易的工作效率 , 还可以通过尽调人员自行编制的脚本从客户数据库中的所有订单导出并审阅 , 对业务和财务进行数据一致性核验 。 同时 , 尽调可以对SKU每个月的数据做出统计汇总 , 观察有无异常或不符合逻辑的情况(比如大部分客户每月都只买一单等) 。
离群分析:为了确保互联网公司与用户行为的非直接交易数据的真实性 , 尽调时可以选择一些能够对企业潜在收入带来影响的行为数据 , 比如评论数和点击数等 , 然后针对这些数据进行用户离群行为分析 , 并识别出脱离整群的极端数据值 。
在统计学中 , 离群点是并不属于特定族群的数据点 , 是与其它值相距甚远的异常观测 , 离群点是一种与其它结构良好的数据不同的观测值 , 检测离群点或异常值是数据挖掘的核心 , 通过大数据离群数据检测和聚类检测离群点方法检测出异常用户交易的异常值 , 从而定位刷单行为 。
聚类分析 , 也称为“群分析” , 是一种基于统计学并以相似性为基础的研究分类问题的分析方法 , 同时也是一个数据挖掘的重要算法 。 在对互联网企业尽调时 , 针对真实用户的刷单行为 , 可以通过聚类算法对交易进行群划分 , 在定位特征变量的基础上通过聚类算法和机器学习定位可疑的交易数据 , 然后将交易数据中疑似刷单行为的数据归类并对此数据群进行分布分析与重点排查 , 对可疑的交易数据进行多维度的分析 , 进一步界定异常范围 。


推荐阅读