AI用“AI核弹”饱和攻击的英伟达,如何赢下AI计算新赛场?( 三 )
在All IN AI的英特尔那里 , 他们是如何来构建这一AI计算策略的?
英特尔最先补足的就是AI硬件平台版图 , 而收购则是最快的方案 。 2015年 , 英特尔先是天价收购了FPGA的制造商Altera , 一年后又收购了Nervana , 为全新一代AI加速器芯片组奠定了基础 。
去年12月 , 英特尔再次花掉20亿美元高价收购了成立仅3年的以色列数据中心AI芯片制造商Habana Labs 。 与英伟达收购Mellanox一样异曲同工 , 通过收购Habana , 英特尔也将补足数据中心场景下的通信和AI两种能力 。
受到这一收购的激励 , 英特尔宣布停止去年8月才发布的用于AI训练的Nervana NNP-T , 转而专注于推进Habana Labs的Gaudi和Goya处理器产品 , 以对标英伟达的tesla V100和推理芯片T4 。 此外 , 一款基于Xe架构的GPU也将在今年中旬面世 。
在软件层面 , 为应对异构计算带来的挑战 , 英伟达在去年11月发布了OneAPI公开发行版 。 不管是CPU、GPU、FPGA还是加速器 , OneAPI都尝试最大程度来简化和统一这些跨SVMS架构的创新 , 以释放硬件性能 。
尽管英特尔以“全力以赴”的姿态投入到AI计算当中 , 通过四处出手收编了涵盖GPU、FPGA 到ASIC的AI芯片产品阵列 , 并建立了广泛适用的软硬件生态 。 但是在挑战英伟达的通用GPU产品上面 , 仍然还有一定距离 。
图片
首先 , 英特尔通过CPU适用于AI计算的策略一直未能得到主要云计算厂商的青睐 , 大多数厂商仍然乐于选择CPU+GPU或FPGA的方案来部署其AI训练的硬件方案 。 而GPU仍然是英伟达的主场 , V100和T4仍然是当下数据中心主流的通用GPU和推理加速器 。
其次 , 英特尔在AI芯片的布局才刚刚发力 , 受到Nervana AI芯片一再延迟的影响 , Habana产品才刚刚开始进行整合 , 这将使得英特尔短期内难以挑战英伟达的AI服务器芯片的市场份额 。
而现在英伟达最新的安培架构的A100 GPU以及AI系统集群的发布 , 更是给英特尔以及市场其他竞争对手一场饱和攻击 。 尽管说 , 长期来看云计算厂商和AI服务器芯片厂商开发的定制芯片会侵蚀一部分GPU的份额 , 而如今都要先跨越英伟达A100所搭起的AI计算的坚壁与高墙 。
AI计算升级 , 带来数据中心全新布局方案
我们先看数据中心本身的变化 。 受到AI相关应用需求和场景的爆发式增长 , 中小型数据中心无法承受如此巨量的“AI计算之痛” , 市场对超大型数据中心的需求越发强烈 。
第一 , 以亚马逊AWS、微软Azure、阿里、谷歌为代表的公有云巨头 , 正在占据超大型数据中心的主要市场份额 。 一方面 , 超大型数据中心将带来更多的服务器及配套硬件的增长;另一方面 , AI算法的复杂度增加和AI处理任务的持续增长 , 又需要服务器的配置以及结构得到持续升级 。
在一些视觉识别为主的AI企业 , 建立一个超算中心就需要部署上万块GPU , 对于那些TOP级云服务商的云计算数据中心 , 为支持深度学习训练任务 , 所需要的GPU量级也将是海量级别 。
第二 , 云服务厂商都在推出自研的芯片 , 来缓解因为价格昂贵和数据量巨大而带来的GPU计算成本飙升的问题 。 这些厂商推出的大多是推理芯片 , 以节省GPU的通用算力 。 但这些推理芯片只在通用性上面的不足 , 造成其很难突破自研自用的局面 。
那么,英伟达的A100 GPU芯片的发布 , 对云计算数据中心带来哪些新的变化呢?或者说为AI服务器芯片的对手们设立了怎样的门槛呢?
首先 , 作为采用全新的安培架构的A100 GPU , 支持每秒1.5TB的缓冲带宽处理 , 支持TF32 运算和FP64双精度运算 , 分别带来高达20倍FP32的AI计算性能和HPC应用2.5倍的性能提升 。 此外还包括MIG 新架构、NVLink 3.0以及AI运算结构的稀疏性等特性 , 这些使得 A100 加速卡不仅可用于AI训练和AI推理 , 还可以用于科学仿真、AI对话、基因组与高性能数据分析、地震建模及财务计算等多种通用计算能力 。 而这一解决方案有可能缓解很多云服务厂商在推理上面的计算压力 , 也对其他厂商的推理芯片带来一定的竞争压力 。
推荐阅读
- 中金网|贾瑶琪:攻击无处不在 区块链安全和隐私问题有点与众不同
- 金盾|网站服务器防护CC攻击,WAF启到哪些重要作用?
- 国际安全智库|Sophos防火墙遭网络攻击:传统安防如何升级,才能走在威胁之前?
- [网络]英国易捷航空遭网络攻击信息泄露 约影响900万旅行者
- 钟小兵物联网DDOS攻击,新基建下的物联网安全问题
- cnBetaTB三星解释Galaxy S20安全芯片可抵御硬件攻击的原理
- 开源中国雷电接口存缺陷,2019 年之前生产的任何 PC 都易受到“Thunderspy”攻击
- i科技Fashion他是阿里最强“守护神”:年薪800万,每天挡住20亿次黑客攻击!
- 「黑客」Ghost博客平台服务器被黑客攻击并安装了加密货币挖掘软件
- 库克:库克:苹果不仅站稳高端市场,还要更深入的“攻击”安卓手机市场
