十年之后,再看数据湖( 四 )
一是轻松分析多源数据:OSS , TableStore , RDS等 , 让不同存储源中的数据 , 具备分析能力;二是能够对异构数据源做关联分析;三是全Serverless结构 , 无需长期持有成本 , 可按需使用 , 更灵活 , 资源伸缩方便 , 升级无感知 。
华为的数据湖服务则分为两类 , 一是华为云提供的数据湖探索(Data Lake Insight , 简称DLI)服务 。 DLI兼容Apache Spark和Apache Flink生态 , 可实现批流一体的Serverless大数据计算分析服务 , 并支持多模引擎 。 借助DLI , 企业仅需使用SQL或程序就可轻松完成异构数据源的批处理、流处理、内存计算、机器学习等 , 挖掘和探索数据价值 。
二是华为智能数据与存储产品线的智能数据解决方案FusionData 。 FusionData通过从多样化数据连接、智能数据处理以及智能数据使能三个方面重新定义 , 旨在通过提供“采-存-算-管-用”全生命周期的管理能力 , 让数据存得下、流得动、算得快、用得好 。
除云服务商外 , 在国内还能看到 , 提供数据湖解决方案的还有易华录和戴尔两家存储厂商 。
数据湖并非万能解药
即便数据湖有着诸多优势 , 但这并不代表着数据湖是解决企业数据问题的万能良药 , 且自身无任何不足 。
例如 , 数据湖面临的一个很大挑战便是数据沼泽 。 正如上文所说的Hadoop并不具备数据治理能力一样 , 当存储在Hadoop中的数据越来越多 , 如果数据湖没有得到有效“分流”、治理的话 , 整个数据湖中的数据将难以应用 , 最终成为数据沼泽 。
同时 , 数据湖与数据仓库 , 也并非二选一的问题 。 正如二者的应用场景般 , 对于BI查询、报告分析等 , 数据仓库仍是更好的选择 。 所以数据湖和数据仓库二者可协同应用于企业内部 。 例如 , 企业可以将数据湖接收到的结构化数据移动到数据仓库中 。
推荐阅读
- 最极客网|原创 中兴推5G视频手机,衰颓之后还能凭技术回归主流吗?
- 互联网乱侃先生|国产机们不用再看高通脸色?超级芯片巨头入场,GPU比高通强很多
- Epic极客速递|继华为研发麒麟之后,OPPO的马里亚纳计划也在稳步推进
- 国美国美方巍:与京东谈判是与拼多多合作之后,双方交流一周
- SpaceX马斯克SpaceX是怎么战胜巨头波音的?也结束美国对俄罗斯十年依赖
- |继官方官宣小米手环5之后,小米手环5代码再爆料
- 服务京东618还只会剁手囤货?疫情之后,这个东西非买不可!
- 苹果|继Home键、耳机孔之后,苹果将取消iPhone充电接口
- 子阳数码|6月1日之后,手机稳定器面临“失业”,一款微云台手机即将亮相
- 电动星球News|失去华为,失去中国智能汽车三十年? | 硬核时间
