数据|什么才是顶级数据团队?我们采访了领英、滴滴等6位数据团队负责人找答案

_原题为 什么才是顶级数据团队?我们采访了领英、滴滴等6位数据团队负责人找答案
数据|什么才是顶级数据团队?我们采访了领英、滴滴等6位数据团队负责人找答案
文章图片

大数据文摘出品
随着大数据的范畴被逐渐拓宽 , 也有越来越多的从业者加入了数据团队 , 其建设对于企业来说也更具挑战 。
为了解答这些疑惑 , 清华大学大数据研究中心联合大数据文摘 , 发起了一次深度调研 , 我们在过去的两个多月里 , 走访了来自全球不同行业的6家顶级数据团队 , 并且跟他们的负责人深入聊了聊“数据团队”这个话题 。
6位顶级数据团队负责人分别是(按照走访顺序):

  • 滴滴技术副总裁、数据科学与智能部的负责人赖春波;
  • 领英全球数据科学团队负责人许亚;
  • 腾讯安全副总裁黎巍;
  • 联想数据智能业务集团产品及生态总经理田日辉;
  • 中国移动信息技术中心大数据平台部副总经理尚晶;
  • 美团数据平台负责人李闻 。
本次访谈涵盖了国内外不同行业及发展阶段的公司或组织 , 力求从尽量多的角度还原现阶段数据团队的建设全景 。
研究内容目前已经汇总入了一份《顶级数据团队建设全景报告》 , 如果你还没来得及看 , 那么今天 , 文摘菌就用这篇文章带大家回顾一下 , 他们是如何定义和建设自己的数据团队的 。
以下为报告中对6位数据团队负责人深度访谈的精华内容 。
滴滴:数据体系团队四大模块 , 助力业务可持续发展
据滴滴技术副总裁、数据科学与智能部负责人赖春波介绍道 , 滴滴的数据体系分为四大模块 , 大数据架构、数据平台、数据治理、数据科学 。 在职位划分中 , 下面三大模块多为工程师、产品经理、数据开发工程师 , 数据科学分为数据分析师和数据科学家 , 他们数量最多 , 以“嵌入式”的方式 , 分布在不同的业务部门中 。 其中 , 数据科学团队 , 需要在业务形态中实现广泛的运营智能、产品智能和决策智能 , 助力业务可持续发展 。
赖春波介绍 , 由于滴滴有网约车、车主服务、两轮车、代驾、出租车等多个业务群 , 滴滴的数据科学家也就很自然地分散在不同的业务部门里 。 为了能更全面准确赋能业务 , 滴滴组建了数据科学委员会 , 增强跨业务数据科学家间的交流和协作 , 同时对复杂问题进行决策 , 迭代数据体系建设 。
【数据|什么才是顶级数据团队?我们采访了领英、滴滴等6位数据团队负责人找答案】滴滴的数据科学委员会成员占比最多的是数据分析师 , 他们每季度开会一次 , 主要针对公司的规划服务和长期定位等进行商讨 。
而这些例行会议并不只是技术交流 。 毕竟除了技术能力和批判性思考的能力外 , 一个好的数据分析师还需要足够的商业能力、战略视野、影响力、领导力和同理心等素养 , 每次会议也不可避免地涉及到相关领域的讨论 。
“分析师需要把自己脑袋的东西放到别人脑袋 , 是靠嘴吃饭的 。 ”赖春波笑称 。
不过要想真正提升产品、运营和决策的智能化 , 只靠一张嘴是远远不够的 。 赖春波介绍 , 数据科学团队每周会产出四五十份的专题分析研究和每周几千次的实验和评估 , 这些都随时可能影响到公司决策 。 前者会呈金字塔式排列 , 最顶端的体系化和方向性研究是真正实现辅助战略的决策智能 , 投入的精力也更多;后者主要针对业务或产品的方案进行评估 , 相对更加自动化和流程化 。
领英:三大KPI指标 , 量化数据团队工作
领英全球数据科学团队负责人许亚表示 , 两年前她接手领英数据团队后做的第一件事就是拟定了团队成功的三要素 。 虽然数据团队的价值有时候很难量化 , 但是有三个指标可以作为探讨的基础 。 在数据团队内部不同组可能会有不同的侧重 , 但对大部分组来说这三个因素都很重要 。
数据易得性和工作效率
数据易得性 , 指的是当外界需要数据的时候 , 获得这些数据的难易程度;工作效率 , 指的是一个人的工作是否可以提升整个团队的工作效率 。
许亚表示 , 数据科学家之前被人诟病过于追求新鲜感 , 喜欢挑战高难度问题 , 但做完MVP (Minimum Viable Product) 后没有维护迭代的习惯 , 永远都在追逐下一个新难题 。 数据团队拥有许多数据资源 , 比如原始数据 , 指标数据 , 数据模型 , 数据可视化 。
当外界对这些资源有需要的时候 , 如何能够保证这些需求能够随时被满足?软件开发有一系列衡量数据获取难易程度的指标 , 比如SLA(Service-Level Agreement)的达标率就是一个很好的量化指标 。
有些数据科学家做了一个很不错的分析 , 但是不太关心怎么把这个分析过程自动化 , 所以每次有人提需求的时候就需要有人再手动跑一次模型 , 其实都是重复劳动 , 不同的人在做相同的重复劳动 。 如果这个分析实现了自动化 , 大家都可以享用 , 其他人就不需要花太多时间精力在这个模型上 , 整个数据科学团队的集体工作效率都提高了 。
以前许亚的团队也缺少这种分析自动化产品化的意识 , 所以她把这个设置为成功三要素之一 , 强调这种意识的重要性 。


推荐阅读