阿里云官网阿里云飞天洛神2.0:高性能网络软硬一体化技术实践( 二 )


通过硬件化 , vSwitch的性能对比软转发提升了10倍以上 , 延时大幅降低 。 Gateway硬件加速
Gateway是VPC所有流量的入口 , 也是云网络带宽和稳定性压力最大的一环 。 随着搬站和企业上云的推进 , 专线流量出现了数量级的增长 , 达到几十Tbps 。 这么大的流量 , 通过堆服务器来提升转发能力基本成了不可能完成的任务 。
传统交换芯片的数据面对客户是固定的pipeline;云网络由于业务和需求变化快 , 没有业界通用标准 , 方案基本都是按需做定制 , 没法使用固定转发的交换芯片 。 可编程交换芯片的出现给云网络打开了一扇窗 , 让Gateway硬件化成为可能 。
为应对超大流量的挑战 , 阿里云网络团队启动了基于可编程交换芯片的Gateway设计 。 经过一年多的努力 , 成功实现了Gateway的软硬结合设计

阿里云官网阿里云飞天洛神2.0:高性能网络软硬一体化技术实践
本文插图

通过可交换芯片的加速 , Gateway单机bps性能提升20倍以上 , 单机pps性能提升近百倍 , 延时降低数十倍 , 整体Capex和Opex大幅降低 。 客户价值
技术创新的目的是为了更好的客户体验 , 实现客户第一的目标 。 通过软硬一体化的技术 , 阿里云可以给客户提供更大带宽/更低延时/更加可靠的网络连接 。

阿里云官网阿里云飞天洛神2.0:高性能网络软硬一体化技术实践
本文插图

持续演进
可编程交换芯片的转发能力强 , 但片内SRAM/TCAM容量有限 。 阿里云体量大/客户多 , 表项规格大 , 没法全量下发到硬件里 。 解决方法之一是对表项做水平拆分 , 但云网络的业务复杂 , 客户的配置变化快 , 水平拆分的难度大/成本高 。 解决方法之二是软硬结合+动态调整 , 通过速率计算动态检测大象流/长尾流 , 长尾流动态调整到软转发 , 大象流动态调整到硬转发 , 软硬一体/动态优化 。

阿里云官网阿里云飞天洛神2.0:高性能网络软硬一体化技术实践
本文插图

云网络的二八原则明显 , 长尾流的表项大/流量小 , 大象流的流量大/表项小 。 通过软硬结合+动态调整的方式 , 一个集群可以容纳全量配置 。 软转发弥补硬件的表项容量问题 , 硬转发弥补软件的转发能力问题 , 相互配合/相得益彰 。


推荐阅读