【阿里巴巴集团】3万字详细版 介绍阿里巴巴达摩院15个实验室研究领域和科研成果(13)


  • 自治化与智能数据库
通过分析系统运行环境状态和日志数据信息 , 利用机器学习手段建模 , 来实现动态系统参数调整和系统优化 , 减少系统DBA的运维成本 。 在数据库系统查询与分析优化器的关键模块上运用这些技术可以实现从规则优化器和初级的性能优化器向高级的机器学习模型为主的高纬度查询优化器的演变 。 机器学习技术也可以帮助系统建立更加准确高效的在线预警与实时监测系统 , 来实现智能的DBA运维管控和资源调配 。 海量结构化 , 半结构化与非结构化数据的分析建模则提出了如何建立深度数据分析的智能数据库系统的科研问题 。
  • 新硬件加速与数据存储
数据库系统需要研发CPU / GPU / FPGA异构计算体系的计算流程 , 在优化多核高并行的数据查询与分析任务时 , 必须要考虑系统硬件的体系结构(例如NUMA架构) , 来减少数据移动并实现数据为中心的查询和分析模式 。 例如NVM和RDMA课题 。
  • 数据库核心算法
数据库系统设计中的各个方向和各个层面都会涉及到一些核心的算法挑战 , 例如并发控制 , 数据处理 , 系统调度 , 近似计算 , 非结构化数据分析和特征提取等 。 有效的解决这些问题需要将算法设计思想与数据库系统的系统运行状态和特征有机的结合考虑 , 这要求数据库系统的核心算法构建不断地接受新挑战和迭代变化的要求 。
产品及应用
  • 国家气象大数据解决方案 中国气象的气象大数据分析平台采用OLAP引擎的高吞吐实时入库和高并发读写支持并发复杂查询能力 , 基于聚集列实现单气象站历史数据毫秒级查询分析 , 存储从1957年建站以来6万气象站的分钟级数据 , 实现入库到应用展示分钟内业务目标 。
  • 邮政/地产等行业解决方案 万科和中国邮政通过使用分布式数据库水平扩展等核心能力 , 线性提升了整体数据库存储及计算容量处理能力 , 通过分布式事务处理引擎提供的数据库拆分能力 , 快速地支持二者核心业务系统迭代 , 大幅节省客户针对数据库层面的运维成本 。
  • 国家重大项目技术支持 支持公有云和专有云国家重大项目 , 例如上海城市大脑、国税等 。
研究团队
【阿里巴巴集团】3万字详细版 介绍阿里巴巴达摩院15个实验室研究领域和科研成果
本文插图

李飞飞
李飞飞 达摩院数据库与存储实验室负责人
犹他大学计算机系终身教授 。 曾获ACM、IEEE、Visa、Google、HP、华为等多个奖项 , 获IEEE ICDE 2014 10年最有影响力论文奖、ACM SIGMOD 2016最佳论文奖、ACM SIGMOD 2015最佳系统演示奖、IEEE ICDE 2004最佳论文奖、美国NSF Career Award、中国基金委海外重点研发奖 , 2018年ACM杰出科学家等 。 担任多个国际一流学术期刊和学术会议的编委、主席 。
【阿里巴巴集团】3万字详细版 介绍阿里巴巴达摩院15个实验室研究领域和科研成果
本文插图

曹伟
曹伟 达摩院数据库与存储实验室资深技术专家
阿里云数据库团队负责人 , 计算机协会数据库专委会委员 。 在SIGMOD、VLDB、TSC等国际学术会议与期刊上发表多篇文章 。 研究领域包括分布式数据库与存储系统、大规模实时计算等 。
【阿里巴巴集团】3万字详细版 介绍阿里巴巴达摩院15个实验室研究领域和科研成果
本文插图

吴结生
吴结生 达摩院数据库与存储实验室研究员
俄亥俄州立大学计算机博士学位 。 2014年加入阿里云西雅图 , 任职存储基础平台和云存储的负责人 。 曾就职于微软 Azure 存储团队 (2008-2014年) ,Ask.com 基础设施团队(2004-2008年)和中国科学院计算技术研究所(国家智能计算机研究开发中心 , 1996-1999年) 。 研究兴趣包括大规模分布式系统和大数据处理和分析系统等 。


推荐阅读