IT新经济|为日均服务十亿人次做准备,美团数据团队如何走在业务前想问题( 四 )


资源内部按钱结算是美团在成本治理层面所使用的核心策略 。 在这一策略的支撑下美团在2017年就已经做到了内部的云化和资源按钱结算 , 在美团内部 , 数据平台对每种资源类型都会有定价 , 各条业务线技术负责人提出储存和计算的需求 , 业务线BM可以直接看到本业务线在大数据上花多少钱 , 数据平台会从技术视角Review资源需求的合理性 , 最后结合全局优化目标将资源转化为机器采购 , 提交给云计算 。 数据平台除了作为公司大数据成本的技术把关人 , 同时也提供能力和工具支持各业务线成本优化 , 以及在底层引擎层面做持续的迭代和优化 , 底层引擎每年都会有接近10%的效率提升 。
“实际上 , 通过这样一套机制能持续去推动每一个业务线去做优化 。 因为每一个业务线都有一套自己的商业模型 , 要去核算自己的成本和收益 , 你只告诉他们花多少资源 , 花多少机器 , 实际上是没有什么帮助的 。
”如果从这一角度而言 , 在业界 , 美团算是一个“先行者” 。
从支撑业务到驱动业务
目前 , 美团的数据平台技术体系 , 早已经度过了“基于开源搭一搭 , 魔改一下就能解决问题”的阶段 , 业界开源技术已经不能满足业务需求 , 需要在部分领域构建能力做自研 。 另一方面 , 也度过了“对外对标业界技术、学一学就能坐时光机少走弯路”的阶段 , 由于美团业务特点和发展阶段 , 数据平台技术领域碰到的问题 , 很多是独特的 , 通过对标业界已经无法获得更多有效输入 , 已经需要通过紧密结合业务问题和领域技术发展趋势 , 向内深度自我洞察、自我反思 , 在领域内自我技术突破、从工程技术支撑业务到工程技术驱动业务的转变 。
“美团整个数据平台技术在业界应该还是比较靠前的 , 例如整个架构技术 , 很早就解决了大规模数据复杂关联场景多地域的平滑扩展性问题 。 ”在谈及美团技术优势时 , 李闻表示 , “我们很早就做完了计算引擎的内存化升级 , 持续做计算效率的一些迭代 , 在成本治理领域是比较独特的 。 另外 , 在整个工具层面实际是一套平台 , 一个大的集群 。 而其他很多公司只是一些小的平台或者小的自建的集群 , 数据打通共享是个大问题 , 当然这跟公司的发展阶段有很大的关系 。 在机器学习训练部分 , 我们可以做到700并发0.7倍的加速比 , 推理部分BERT模型性能可以超越业界state-of-the-art 1~2倍的样子 , 虽然取得了一些成绩 , 但是未来的挑战也很大 , 美团数据团队还是会本着求真、务实的心态 , 长期有耐心 , 去迎接这些挑战 。 ”
互联网下半场 , 数据团队的未来
2020年3月4日 , 美团迎来十周岁的生日 。
根据美团2019年年度财报显示 , 美团平台上有单骑手数量已经达到了399万 , 高峰期外卖日订单量达到了3000万单 , 超过4.5亿的用户在美团上获取生活服务 , 而线上有超过610万的商户……这些数据背后能带来的产出对美团来说是一笔重要的财富 。
也正是因此 , 数据团队在美团的位置举足轻重 。 问及在权衡数据团队的商业影响力方面的思考 , 李闻提到数据技术团队的KPI主要看两部分 , 一是能不能支撑好全公司所有数据团队的工作 , 比如开发效率、数据使用效率等;二是要考虑与全局数据成本、全局数据质量相关的一些KPI 。
李闻说:“在美团有一条非常重要的价值观 , 就是追求卓越 。 未来的路还很长 , 美团数据团队也希望能够挖掘出更多的数据价值 , 并将这些价值转为生产力 , 帮助公司乃至帮助社会提升效率 , 创造出更大的价值 。 ”


推荐阅读