![]()
文章插图
4.2.3阿里DDI(databricks datainsight 数据洞察)
文章插图
产品核心:
- 基于商业版 Spark 的全托管大数据分析& AI 平台
- 内置商业版 Spark 引擎 Databricks Runtime ,在计算层面提供高效、稳定的保障
- 与阿里云产品集成互通,提供数据安全、动态扩容、监控告警等企业级特性
产品引擎与服务:
- 100% 兼容开源 Spark,经阿里云与 Databricks 联合研发性能优化
- 提供商业化 SLA 保障与7*24小时 Databricks 专家支持服务
产品关键信息与优势
文章插图
文章插图
4.2.3.1产品架构
文章插图
- Databricks数据洞察构建在ECS之上,使用阿里云对象存储服务(OSS)为核心存储 。存储访问加速层方便您可以像操作HDFS上的数据一样访问OSS上的数据 。
- Databricks数据洞察提供了两种执行Spark作业的方式,包括通过Notebook或者在项目空间里新建Spark作业 。
- Databricks数据洞察还提供了监控告警、元数据管理、权限管理等功能,方便您对集群资源进行管理 。
4.2.3.2应用场景
1、数据湖分析
使用阿里云对象存储OSS作为云上存储,DDI集群提供灵活的计算资源,OSS上的数据可以被多个DDI集群共享,减少数据冗余 。同时,DataInsight Notebook支持多用户同时协同工作,您可以在Notebook中完成作业编辑、提交和结果查看 。
文章插图
2、实时数仓
利用Databricks Delta Lake的ACID事务特性,可以构建云上大数据的实时数仓 。
文章插图
五、华为数据湖探索(Data Lake Insight,以下简称DLI)5.1产品架构
数据湖探索(Data Lake Insight,以下简称DLI)是完全兼容Apache Spark、Apache Flink、openLooKeng(基于Presto)生态,提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务 。DLI是完全托管的大数据处理分析服务,企业使用标准SQL、Spark、Flink程序就可轻松完成多数据源的联合计算分析,挖掘和探索数据价值 。数据无需复杂的抽取、转换、加载(ETL),使用SQL或程序就可以对云上CloudTable、RDS、DWS、css、OBS、ECS自建数据库以及线下数据库的异构数据进行探索 。
文章插图
5.2功能介绍
DLI用户可以通过可视化界面、Restful API、JDBC、ODBC、Beeline等多种接入方式对云上CloudTable、RDS和DWS等异构数据源进行查询分析,数据格式兼容CSV、JSON、Parquet、Carbon和ORC五种主流数据格式 。
- 三大基本功能
-
- SQL作业支持SQL查询功能:可为用户提供标准的SQL语句 。具体内容请参考《数据湖探索SQL语法参考》 。
- Flink作业支持Flink SQL在线分析功能:支持Window、Join等聚合函数、地理函数、CEP函数等,用SQL表达业务逻辑,简便快捷实现业务 。具体内容请参考《数据湖探索SQL语法参考》 。
推荐阅读
- 娃娃沉迷手机怎么办 娃娃迷上手机怎么办
- 比亚迪|王朝、海洋网车型最高涨价1万 比亚迪辟谣
- 如何教育孩子不要攀比 孩子攀比怎么教育
- 孩子厌学怎么沟通 孩子厌学怎么沟通呢
- 孩子爱发脾气是怎么回事 孩子爱发脾气是怎么回事啊
- 推拉门用什么材质好 衣柜推拉门用什么材质好
- 橱柜门用什么材质好打理 橱柜门用什么材质好
- 背景墙用什么材质好 背景墙用什么材质好?
- 华为 Harmony OS 3.0 新功能曝光:文件中转站、智慧视觉等
- 橱柜用什么材质好 厨房橱柜用什么材质好
