未来已来!分布式数据库的“星辰大海”绝不仅限于替换( 二 )


分布式数据库的出现可以很好地解决数据库实例批量管理中,扩展困难以及维护困难的问题 。同时,基于引擎级多模技术,分布式数据库可以基于同一份数据,支撑多种数据库引擎的联机交易,通过跨引擎事务一致性能力,为客户打通微服务架构下异构数据源的ACID一致性 。因此,分布式数据库技术相比传统Oracle等数据库更有利于微服务化,为企业打通底层数据,降低数据的存储及管理成本 。助力研发团队进行DevOps持续交付,提升产品研发效率 。

未来已来!分布式数据库的“星辰大海”绝不仅限于替换

文章插图
3) 海量数据实时访问
海量数据的存储和计算通常由数仓(MPP数据库)或大数据平台(Hadoop)完成,数据量往往达到千亿(甚至万亿)级别 。传统应用中,由于数仓中需要预先完成数据清洗入库,数仓及大数据平台无法支持实时并发数据访问,限于现有平台的处理模型,因此难以进行联机业务的创新 。然而,数据化转型过程中,对客联机交易、历史数据服务平台或IoT物联网系统中,会产生要求联机实时处理海量数据的解决方案 。
分布式数据库可以在这一场景中,协助企业客户获得更佳的使用体验 。首先,分布式数据库与Hadoop及数据仓库一样具有很好的弹性扩展能力 。其次,分布式数据库可以提供与传统关系型数据库同等的ACID支持,以保障其关键业务的事务一致性 。最重要的是,分布式数据库可以更好地支持高并发的业务访问,可以像使用单机数据库一样,在包含几千亿甚至万亿级记录的表中实现毫秒级数据检索 。
未来已来!分布式数据库的“星辰大海”绝不仅限于替换

文章插图
4) 非结构化数据治理
非结构化数据包括图片、文档、音视频等对象文件,以往只是单纯存放于存储系统中,提供单一的保存及调取功能 。因此,除了直接操作这些文件的业务系统外,非结构化数据对于企业中的其他系统就是一个黑匣子,无法发挥数据的潜在价值 。
如今的业务系统往往开始大规模联机使用这类非结构化数据 。例如,在业务中各类文件采集,交易过程头像、指纹、声纹监管要求的原档留存,各类业务的360客户画像系统,处理过程需要与非结构化数据进行高频比对,并发处理及采样修正,这些场景都需要非结构化数据的联机实时管理 。单纯采用NAS或网盘存储海量非结构化数据,早已经无法满足这类实时联机处理能力的需求 。
同时,数字化转型中非结构化数据不再是静态的文件 。通过AI机器学习及比对分析,非结构化数据将包含更多元化的业务属性,为各类业务系统提供信息输入 。因此,需要对其进行有效的分类治理,盘活非结构化数据资产的潜在价值 。
未来已来!分布式数据库的“星辰大海”绝不仅限于替换

文章插图
分布式数据库可以有效提升非结构化数据的实时处理能力,结合引擎级多模能力统一存储结构化及对象数据,可以有效地实现基于标签特征数据的分类治理,成为企业「非结构化数据治理」建立坚实的底座 。
 
分布式技术演进趋势从技术角度,在各行业对海量数据、互联网类应用快速发展的需求中,弹性扩张、多模式等功能是传统Oracle数据库所难以满足的,也是分布式数据库存在的最大价值与目的 。在这类技术背景下,做到“不使用Oracle而选择分布式数据库”是最正确的答案 。分布式数据库的最佳落地与使用方式,正是从海量数据业务到核心的逐步迭代过程 。先从存在海量数据弹性扩展的新兴业务需求入手,随着业务革新不断的深入,逐渐渗透进传统业务及应用中 。
1) 弹性:存算分离实现灵活扩展
作为分布式数据库,弹性扩展能力是其存在的核心意义与价值 。相比起传统MPP数据仓库,新型分布式数据库可以基于存算分离的部署模型,实现存储与计算资源独立扩展的能力,实现对应用层面无感知的按需弹性扩展 。
未来已来!分布式数据库的“星辰大海”绝不仅限于替换

文章插图
2) 事务:原生分布式强一致性
在分布式技术逐步贴近业务核心的过程中,客户对于ACID事务一致性的要求也持续提升 。例如,在联机交易业务中,往往要求“RR级别事务隔离”能力 。在这类需求中,基于分库分表技术的解决方案,由于数据库本身无法提供此支持,(部分产品甚至不提供事务支持或通过1PC提交进行弱化) 。导致需要借助大量外围应用程序逻辑配合,才能达到最终一致性的效果,大量消耗开发人员的设计精力 。而原生分布式数据库,得益于源自内核的分布式设计,客户可以放心地将事务一致性逻辑交由数据库层进行处理,让开发人员回归到纯粹的业务设计,为业务提供直接有效的研发产出,提升企业研发效率 。


推荐阅读