大数据&云计算|欧洲航天局行星探索项目核心数据库TBase,开源版本重磅升级
本文插图
你知道被欧洲航天局作为“Gaia Mission”行星探索项目的核心数据库是哪个吗?没错 , 它是腾讯开源的自研HTAP分布式数据库TBase 。
2020年7月 , 腾讯自研的HTAP分布式数据库TBase正式迎来重大升级 , 发布了最新开源版本2.1.0 。 此次开源发布 , 不但带来了性能的大幅提升 , 还带来了分布式多活的能力 。
TBase是腾讯基于PostgreSQL自主研发的分布式HTAP数据库 , 最早可以追溯到2009年 。 2019年11月 , TBase在腾讯首届Techo开发者大会上宣布开源 , 笔者还保留了去年11月宣布开源时公布的数据 , 概述了TBase的特点 。
本文插图
TBase开源之后 , 立即受到了开源社区的极大关注和密集反馈 。 截止目前 , TBase在GitHub上的Star数已经超过800个 , Fork数近200个 。
其中 , 欧洲航天局(European Space Agency, 即ESA) 的Gaia Mission项目选择TBase作为其恒星探索项目的核心数据库 , 处理着银河系1%的恒星群的研究数据 , 是真正意义上的海量数据 。 ESA也是TBase开源社区的重要的贡献者 。
TBase在开源社区受到如此关注 , 笔者也怀着一颗慕道之心对最新开源版本进行了一番架构与技术挖掘 , 发现TBase的最新版本确实给我们带来了很多惊喜 。
TBase的物理架构是一个典型的分布式无共享(Share Nothing)数据库 , 示意图如下:
本文插图
一个典型的TBase数据库集群包含了三种角色:
若干个协调节点Coordinator (CN)
若干个数据节点Data Node (DN)
一个全局事务管理器(Global Transaction Manager , 即GTM)
TBase的CN提供对外接口 , 负责数据的分发和查询优化执行等 , CN只保留全局的元数据信息 。 DN是数据节点 , 它们保存实际数据 。 全局数据以分片(Sharding) 的方式分区存储在不同的节点 。 多个CN都提供同样的全局视图 , 写操作可从任何一个CN进行 , 便于实现多主/多活 。
在最新开源的2.1.0版本里 , TBase更是增加了异地多活部署的支持 。 这让分布式数据库从传统的只有一个主中心提供读写能力 , 其他中心节点提供只读能力的部署 , 升级成为跨地南北两套系统都能独立提供读写服务 , 系统内部则通过逻辑复制技术进行双向数据同步 。 这一“宝藏”架构是目前市场上分布式数据库里最领先的解决方案 。
大家都知道 , 优化器是数据库的核心组件 。 腾讯在数据库领域已深耕和打磨了近10年 , 在优化器上有深厚的技术积淀 。 在2.1.0版本中 , TBase将难以优化的subselect 等子查询类型 , 在满足优化条件时转化成不同类型的Join来执行 , 创新性地实现了查询性能千倍、甚至万倍级的提升 。 TBase将自己多年沉淀的技术毫无保留地开源 , 省去了大家自己摸索的过程 。
TBase 2.1.0版另一个广受欢迎的性能提升 , 是CN从DN搜集统计信息流程的大幅优化 , 让复杂查询性能够实现数十倍的提升 。 这些性能加速也会让用户体验“飞”起来 。
全局事务管理器 (GTM) 负责全局事务的划分、调度和并发控制 。 TBase对事务的支持是通过MVCC(Multi-Version Concurrent Control , 即多版本并发控制)来实现的 。 与包括谷歌Spanner在内的诸多分布式数据库相比 , TBase实现了多核可扩展的递增时钟生成服务器、低开销的全局时钟一致性协议 , 以及基于全局时钟的MVCC多版本回收机制 。
这些突破与创新使得TBase作为一款分布式HTAP数据库 , 在提供全局事务的支持下 , 依旧保持了良好的线性扩展能力 , 鱼与熊掌兼得 。
推荐阅读
- 智能穿戴|漫步者DreamPods体验:外观精致佩戴舒适降噪是最大惊喜
- 数据|智领云荣登“中国大数据企业50强” | 2020大数据产业生态大会盛大召开
- 大数据|华云数据荣获中国大数据50强、2020数字赋能先锋企业30强,入选大数据产业发展白皮书及百佳案例
- 驱动中国|即信Fintech智研中心:银行践行社交化运营的要诀--渠道通 交互通 数据通
- 行业互联网|华云数据荣获中国大数据50强、2020数字赋能先锋企业30强,入选大数据产业发展白皮书及百佳案例
- 技术编程|数据结构001之简介
- 行业互联网|爱数亮相第八届医药健康论坛,以数据赋能药企数字化
- 技术编程|边缘云计算到底是什么?
- 行业互联网|智领云荣登“中国大数据企业50强”| 大数据产业生态大会
- 互联网|图匠数据CTO梁柱锦:利用AI与大数据提升线下零售管理能力 | 公开课预告
