中年|建设数据中台?先想想企业有没有这个底子!


【中年|建设数据中台?先想想企业有没有这个底子!】
最近数据中台很火 , 接触的很多企业都在提这个东西 。 然而 , 很多连数据基础都没有、仍然处在数据孤岛阶段的企业 , 上来就说我今年要做数据中台项目 , 这实际上是因为大家都在追热点 , 而没有真正搞明白这个名词的含义 。
那么 , 数据中台到底是什么?它和数据仓库、大数据平台又有什么区别呢?
首先 , 国内的数据中台兴起 , 大多是因为阿里巴巴的马老师提出的”大中台、小前台”的口号 。 所以 , 我们先来看看阿里对数据中台的定义 。
中年|建设数据中台?先想想企业有没有这个底子!
本文插图
数据中台是什么

数据中台是指通过数据技术 , 对海量数据进行采集、计算、存储、加工 , 同时统一标准和口径 。 数据中台把数据统一之后 , 会形成标准数据 , 再进行存储 , 形成大数据资产层 , 进而为客户提供高效服务 。 这些服务跟企业的业务有较强的关联性 , 是这个企业独有的且能复用的 , 它是企业业务和数据的沉淀 , 其不仅能降低重复建设、减少烟囱式协作的成本 , 也是差异化竞争优势所在 。

广义的数据中台包括了数据技术 , 比如对海量数据进行采集、计算、存储、加工的一系列技术集合 , 今天谈到的数据中台包括数据模型 , 算法服务 , 数据产品 , 数据管理等等 , 和企业的业务有较强的关联性 , 是企业独有的且能复用的 , 比如企业自建的2000个基础模型 , 300个融合模型 , 5万个标签 。 它是企业业务和数据的沉淀 , 其不仅能降低重复建设 , 减少烟囱式协作的成本 , 也是差异化竞争优势所在 。
数据中台的价值
1、数据复用
浙江移动已经将2000个基础模型作为所有数据服务开发的基础 , 这些基础模型做到了“书同文 , 车同轨” , 无论应用的 数据模型有多复杂 , 总是能溯源到2000张基础表 , 这奠定了数据核对和认知的基础 , 最大程度的避免了“重复数据抽取和维护带来的成本浪费 。 曾经企业的数据抽取就有多份 , 报表一份 , 数据仓库一份 , 地市集市一份 , 无论是抽取压力、维护难度及数据一致性要求都很高 。 同时 , 统一的基础模型将相关业务领域的数据做了很好的汇聚 , 解决了数据互通的诉求 , 这点的意义巨大 , 谁都知道数据1+1&gt2的意思 。
2、沉淀业务模型

在企业内 , 无论是专题、报表或取数 , 当前基本是烟囱式数据生产模式或者是项目制建设方式 , 无法形成标准化统一业务模型 , 无法沉淀和共享也就无法迭代生长 , 从而造成模型不能真正成为可重用的组件 , 无法支撑数据分析的快速响应和创新 。 只有在迭代生长中的业务模型才能从最初的单一字段 , 逐渐完善形成为企业最为宝贵的统一模型资产和统一数据资产 。
以报表为例 , 企业报表成千上万的原因往往也是没有沉淀造成的 , 针对一个业务报表 , 由于不同的业务人员提出的角度不同 , 会幻化出成百上千的报表 , 如果有报表中台的概念 , 就可以提出一些基准报表的原则 , 比如一个业务一张报表 , 已经有的业务报表只允许修改而不允许新增 , 自然老报表就会由于新的需求而不断完善 , 从而能演化成企业的基础报表目录 , 否则就是一堆报表的堆砌 , 后续的数据一致性问题层出不穷 , 管理成本急剧增加 , 人力投入越来越多 , 这样的事情在每个企业都在发生 。
3、数据驱动业务创新

我们都知道 , 以往的业务决策 , 大多是凭经验拍脑袋的 , 现如今 , 数据的价值和重要性不言而喻 。 企业的管理者在做决策时 , 越来越想要先看数据 。 所以 , 好的数据基础 , 是决策和创新的加速器 。 而现在市场竞争如此激烈的大环境 , 不但需要企业做出正确的决策 , 效率和执行力也是关乎存亡的 , 数据中台即是数据创新效率的保障 。 研究过机器学习的都知道 , 没有好的规整数据 , 数据准备的过程极其冗长 , 这也是数据仓库模型的一个核心价值所在 , 比如运营商中要获取3个月的ARPU数据 , 如果没有融合模型的支撑 , 得自己从账单一层层汇总及关联 , 速度可想而知 。 在如今的互联网时代 , 企业都在全力谋求转型 , 转型的关键是要具备跟互联网公司一样的快速创新能力 , 大数据是其中一个核心驱动力 , 但拥有大数据还是不够的 , 数据中台的能力往往最终决定速度 , 拥有速度意味着试错成本很低 , 意味着可以再来一次 。


推荐阅读