华为数据通信|CloudFabric,引领数据中心网络进入智能时代( 二 )
智能时代的核心就是引入AI挖掘数据价值 , 以深度学习为特征的AI计算依赖海量的数据的输入 , 数据的存取速度将直接影响算力的发挥 。 计算和存储的性能百倍提升导致传统网络的拥塞易丢包带来的网络瓶颈问题开始突显 。 1‰的丢包在AI时代会直接导致算力下降接近 50% 。 而随着业务负载增加和分布式计算流量的增多 , 网络丢包问题将更为严重 。 AI数据中心一方面算力贵 , 算力缺成为时代挑战 , 而另一方面由于网络瓶颈问题导致昂贵的算力无法充分释放 。 如何构建一个0丢包的无损数据中心网络成为面向智能时代的数据中心网络的基本要求 。
华为CloudEngine 16800是业界首款搭载了高性能AI芯片的数据中心交换机 , 承载独创的 iLossLess智能无损交换算法 , 实现流量模型自适应自优化 。 基于CloudEngine交换机构筑的智能无损DCN , 真正实现以太网络0丢包 , 全面释放AI算力潜能 。 根据权威第三方测试机构Tolly测试 , 在同样GPU集群下 , 通t过采用华为智能无损DCN , AI业务的训练效率比采用当前业界其他网络提升27%以上 。
本文插图
华为智能无损 DCN
华为智能无损DCN目前已经应用于代表全球算力巅峰的AI训练集群Atlas900中 , 成为其突破性能瓶颈冲击世界纪录的关键助推器 。 智能无损DCN不仅仅是面向AI训练集群的高性能网络 , 更是代表面向智能时代数据中心的新一代网络新架构 。 率先实现网络全智能 , 迈向自治自愈的自动驾驶
数据中心的规模越来越大 , 结构越来越复杂 , 有些数据中心OPEX支出甚至超过为CAPEX的三倍 , 数据中心的效率和成本面临结构性挑战 , 即便采用当前主流的SDN实现网络的自动部署 , 但是在业务意图理解 , 网络日常巡检 , 故障定位修复等方面 , 仍然依赖管理员 。
华为首先提出自动驾驶网络的理念 , 在SDN网络架构基础上 , 针对网络设备、网络管理控制及上层业务编排系统 , 在规划、部署、运行、维护、优化和经营的端到端过程中引入AI技术 。 通过AI技术使得网络从自动化业务部署和动作执行 , 走向智能化的故障自愈 , 网络自我优化 , 最终实现网络自治自愈和无人值守 。
AI加持的全智能数据中心网络CloudFabric目前已经可以初步实现“智能理解业务意图、智能选取最佳网络路径、智能评估变更风险、智能检测故障和快速定位根因” , 针对75类常见故障 , 可以做到1分钟感知故障、3分钟定位故障、5分钟修复故障 , 率先在数据中心网络领域实现业界首个L3级自动驾驶网络 , 并获得Tolly第三方权威机构的认证 。 全新CloudFabric , 引领数据中心网络进入智能时代
大约2000年左右 , 随着企业信息化战略的发展推进 , 真正的企业数据中心诞生 。 2010年左右企业数字化战略提出 , 云计算方兴未艾之际华为率先发布业界首个云数据中心网络CloudFabric , 引领数据中心进入云时代 , 实现 IT资源的弹性扩缩和自动发放 。
当前企业数字化转型进入智能化升级新阶段 , AI 正在广泛应用于数据中心之际 , 华为对CloudFabric进行全新升级 。 CloudFabric不仅率先完成数据中心网络自身的全智能化 , 实现了业界首个L3级的自动驾驶网络 , 更通过全球最高密400GE的CloudEngine交换机、内嵌AI芯片和独创iLossless算法实现业界唯一的0丢包智能无损DCN , 释放智能时代AI算力巅峰 , 让AI业务运行更高效 , 让数据价值商业变现更充分 , 再一次引领数据中心网络进入智能时代 。
作者:华为数据通信产品线数据中心网络领域总裁 王雷
推荐阅读
- 互联网|5G商用一周年,华为云向互联网企业大抛绣球
- 新智元|英国5G建设病急乱投医,这两家日本企业或成华为接盘侠
- 情感|华为今天如此成功,看一下任正非的岳父是谁,你就知道为什么
- 行业互联网,云计算|赛伯乐携手华为(重庆)人工智能创新中心聚焦AI前沿,助力企业数字化转型
- |反击开始!华为正式起诉美三巨头,网友:一挑三
- 华为手机|泪奔!等等党的心酸,为什么有些手机它偏不降价?
- 折叠屏手机|三星“坑了”华为和小米?七年坚持或正式放弃,全新设计回归传统
- 行业互联网|英媒:替换华为设备成本将由英国消费者埋单
- 台积电|华为无奈!Mate40系列或采用双处理器方案
- 折叠屏手机|三星,柔宇,华为:折叠屏手机内外折的硬核之争
