全球最高性能分布式存储系统幕后黑科技( 二 )

过去:静态设置 , 粗暴反压

最早的无损以太交换机的基本实现依赖网络管理员静态设置阈值 , 特别考验管理员能力 , 一旦设置的太保守 , 则可能降速太多 , 吞吐率很差;设置太激进则无法起到无损的效果 。 在早期FCoE阶段 , 流量模型相对简单 , 基本能够满足业务的诉求 。 但是随着当前RoCE流量模型复杂多变 , 一个静态的阈值无法满足变化的需求 , 当前这种设置方式正在被抛弃 。

现在:动态调整 , 实时反馈

一些领先的网络厂商 , 在静态设置的基础上 , 提出了根据流量模型的变化实时调整阈值从而不断的逼近最优值 , 在吞吐和丢包之间进行平衡 , 取得了较好的效果 , 目前已经成为领先企业的主流选择 。

但是 , 动态调整的问题 , 需要对流量进行实时采集分析 , 在大型框式设备上实现有一定的难度 , 另外虽然通过不断调整力争达到最优值 , 调整过程中与最优值还存在差距 。

未来:智能预测 , 精准控制

2019年初 , 华为发布了业界首款面向AI时代的CloudEngine数据中心交换机 , 率先将AI芯片内嵌交换机中 , 独创iLossless智能无损交换算法 , 实现网络100%吞吐下的真正0丢包与E2Eμs级时延 。 据测试结果 , 效果已经无限逼近了最优值 , 确保无论多么网络拥塞 , 0丢包的基础上接近100%吞吐 , 这就是AIFabric 。 通过AIFabric构建的业界真正实现0丢包的以太网 , 可以将分布式存储网络时延持续的稳定在10us以下 , 揭开存储的天花板 , 充分的释放存储的性能 。


全球最高性能分布式存储系统幕后黑科技

----全球最高性能分布式存储系统幕后黑科技//----

AIFabric助力华为分布式存储系统冲击全球性能之巅

目前AIFabric已经应用到华为最新的OceanStorD系列分布式存储中 , 通过AIFabric可以在同等的条件下 , 将时延降低15% , 助力存储IOPS性能提升20%以上 , 冲击单节点16.8万IOPS的新高度 。 特别是AIFabric确保通过增加存储节点可以接近线性的提升性能 , 而保持时延基本不变 。

以下是实验室模拟的不同的业务负载下 , 分布式存储时延和性能情况 。 可以看到 , AIFabric开启后 , 时延降低了15%以上 , IOPS最高提升了45% 。


全球最高性能分布式存储系统幕后黑科技

----全球最高性能分布式存储系统幕后黑科技//----


全球最高性能分布式存储系统幕后黑科技

----全球最高性能分布式存储系统幕后黑科技//----

同时 , 今年华为云上线了基于OceanStor分布式存储底座的云盘 , 目前已经成为全球性能最高的云盘 , 单卷性能突破100万IOPS , 时延控制在75us , 这背后 , 也是AIFabric在支撑海量数据场景的极致低时延 。 (文/王新)


推荐阅读