DOIT|以武会友,闪存时刻:与浪潮“叶问”畅谈切磋( 二 )


分布式存储、软件定义存储不能划等号 , 叶大师娓娓道来
在很多人的认知中 , 软件定义存储、分布式存储和云存储几乎是可以划等号的 , 与集中式存储之争 , 也是用户关注的话题 。
宋家雨:SDS(软件定义存储)和分布式存储的关系是什么?未来的发展如何?
叶毓睿:软件定义存储脱胎于SDN , 也就是软件定义网络;以及SDDC , 也就是软件定义数据中心 , 很重要的内容 , 是强调数据平面和控制平面分离 。 为什么要做分离 , 实际上就是要实现我们所说的这个软件定义 。
软件定义用一个更通俗话说 , 就是来实现存储即服务这样一个理想目标 。 为此 , 需要在数据平面层去逐渐剥离可操控的成分 , 将其上升到控制平面层 , 实现数据调度、流向、指挥;在数据控制平面 , 通过云管理软件 , 如开源OpenStack、Cinder、Manila、(Swift) , 以及像商业平台VMware的StoragePoliceBasedManagement(SPBM)等 , 自由调用存储 , 以及逻辑卷 , 让控制平面通过API可以快速创建 。
在创建存储卷的过程中 , 可以事先通过策略方式事先定义好 , 包括自动分级、精简配置、去重、压缩 , 快照、容灾等 。 这样就能满足存储即服务的目标 , 实际上 , 这就是一个软件定义的存储 。
在软件定义存储的范畴里面 , 包含了集中式存储 , 也包含了分布式存储 。 但是在市场主流声音当中 , 分布式的存储是更多呈现的方式 , 这是最近几年分布式存储迅猛增长所致 。 如今数字宇宙其实比摩尔定律发展还要快 , 基本上是每18个月新增数据是过去所有数据的总和 。 而在这样一个数据宇宙新增长的数据当中 , 根据IDC的报告 , 实际上有超过80%以上的都是非结构化数据 , 而非结构化数据比较好的一个承载体就是用分布式存储 。
谈到未来的市场演进 , 我觉得在一个比较长的时间内 , 集中式存储和分布式存储会长期并存 。 因为非结构化数据增长幅度要远比结构化数据增加的快得多 , 所以从市场的情况来看 , 集中式的存储基本上没有什么增长 , 甚至是负增长 。 但是分布式存储它的份额在不断的增加 。
在我的印象当中 , 2016年前后谈论最多的概念是SeverSAN , 它简单看成为一个分布式的存储 , 也包含超融合 。 那么这样的一个架构 , 在外部存储市场份额当中不超过10% 。 但是现在看 , 从2019年的数据 , 占比已经超过了40% , 而2018年只有30%+ 。 由此可以看到其发展非常迅猛 。
但我相信在较长的一段时间 , 这两个形态存储会同时存在 。 软件定义存储有一个前提 , 就是硬件发展非常迅猛 , 然后才有软件腾挪空间 。 我们设想一下 , 如果不是有那么多富余的处理器CPU , 怎么可能会有软件定义计算,也就是虚拟化;如果没有性能强劲的SSD , 以及低延时网络、RDMA技术 , 那么也不会出现软件定义存储 。 如果硬件能够继续迅猛发展两种存储形态合二而一也不是没有可能 。
除了硬件迅猛发展 , AI技术在存储、管理的一个深度的应用,如浪潮存储InView , 针对磁盘故障预测 , 能够根据过去历史的容量以及历史性能数据 , 预测未来达到某个时间点的时候 , 容量使用可能达到一个什么样的百分比 , 存储性能可能会达到一个什么样的阈值状态 。 通过这样一个方式去预警 , 决定是不是扩容 。 再往后发展的话 , 是不是可能能够根据历史分析业务应用的场景 , 如果能够把这样的一些算法写到存储智能管理当中 , 未来存储就会变得更加聪明 , 更加智能 。
云化世界 , 切忌云山雾罩 , 听叶大师指点迷津
未来的世界是云的世界 , 从私有云、混合云到容器化、DevOps的变化 , 数据存储如何与之匹配和适应 。
宋家雨:云计算是毫无争议发发展方向 , 云环境以分布式存储为主 , 全闪存阵列在云环境里 , 还有戏分吗?
叶毓睿:相信也会增加 , 云化是未来发展趋势 , 应用初期 , 用户在选择场景应用的时候可能会更多选择一些边缘、非生产系统 。 但是使用习惯逐步深入 , 渐渐也会考虑跟交易相关的、一些生产系统也会转移到云化环境中 , 对性能、低延时也会提出相应的挑战和要求 。 所以 , 我相信无论混闪、全闪也会在云化环境中逐步提高 。 可以看到 , 国内一些公有云目前在提供高性能存储空间 。


推荐阅读