百度|BAT为何纷纷下场“造芯”?( 二 )


更重要的是,由于互联网应用的特殊性,相当一部分新采购的服务器都要进行针对性的优化,或者需要进行部分配件的调整与革新,也就需要投入大量的人力、精力和财力,造成资源的浪费 。
因此对于以腾讯云为代表的云厂商来说,势必要从整机的设计上面,去精简不需要的功能;优化整机的散热能力,降低能耗 。配备一个非常强的供应链的管控 。去降低计算力的单位成本,并进而将这种成本红利释放给数百万的云上用户 。
而在安全方面,从芯片层面就进行自研、定制化,势必能更好的保证整机系统的安全可靠 。
就在近日上海闭幕的世界人工智能大会上,华为轮值董事长胡厚崑表示道:“只有基础打得牢,根技术扎得深,应用创新跑得快,才有人工智能产业的参天大树和生态的持续繁荣 。”
其中技术要扎到根,根深才能叶茂 。值得就是应该大力发展根技术,如处理器、AI计算框架等,增强人工智能产业的发展韧性 。
百度|BAT为何纷纷下场“造芯”?
文章图片
“硬件创新”已成云厂商必争之地
除国内云厂商之外,国外三家规模较大的云服务商亚马逊、微软和谷歌也硬件方面进行重金投入 。用于提高自身云平台的性能或者调优服务来满足特定的用途,例如人工智能开发等等 。
如谷歌把自己的云计算战略重点放在了处理人工智能工作负载上,为此设计了名为TPU的微处理器家族,号称相比GPU的成本更低性能更高 。
对此,谷歌曾对外表示,2015年的时候在多层神经网络ResNet 50上训练一个深度学习模型的成本超过20万美元,而今天,成本比一杯咖啡还便宜 。
此外,微软Project Olympus是一项针对微软基于OCP构建的云平台打造一系列服务器结构块的项目 。AWS基于ARM的Graviton处理器从2015年开始开发,到现在已经在AWS EC2实例中实现普及 。
“硬件专业化可以将延迟、性价比和功耗/性能比提高10倍,但多年来,大多数计算工作负载一直停留在通用处理器上,”AWS工程师James Hamilton在一篇博客文章中这样写道 。亚马逊每年要安装一百多万个专用芯片,专门用于机器学习工作负载 。
亚马逊的Nitro项目则是将硬件和软件结合,消除虚拟化的开销 。
阿里云的神龙架构则也是通过芯片层面的,通过软硬件结合的方式,来降低虚拟化损耗,华为云的擎天、京东的京刚则也是通过同样的方式 。
对此,刘裕勋对雷锋网表示到,云上的客户是非常的“挑剔”的,同时云计算市场的竞争也很激烈,客户都希望用低成本,高质量的产品,客户要求的苛刻会推动我们去做更多的变革和演进 。
在此背景下,对于云服务商而言,通过自研服务器、自研数据中心技术、再到上层的IaaS、PaaS、SaaS平台的协同打造,势必是一条必须要走的道路 。


推荐阅读