[格上私募圈]干掉英伟达?( 二 )


据自动驾驶公司文远之行技术总监钟华回忆 , 十几年前还在卡内基梅隆念书时 , 那个时候给GPU编程需要用机器码深入到显卡内核才能完成任务 , 非常困难 。
“我们用汇编语言写代码 , 写起来真的非常烧脑 。 英伟达推出了Cuda以后 , 相当于把复杂的显卡编程包装成了一个简单的接口 , 造福了广大程序员 。 现在主流的深度学习框架基本都是基于Cuda进行GPU并行加速 。 ”
2007年 , 英伟达正式推出GPU统一计算架构平台Cuda 。 这一架构的里程碑意义在于 , 让GPU不再单独存在于个人用户的显卡中 , 仅为自己的“一亩三分地”工作;而是让GPU通用化 , 把“个人计算机”变成可以并行运算的“超级计算机” 。
虽然初期推广并不顺利 , 但2009年 , 由于基于Cuda的高性能运算研究成果陆续在众多知名期刊发表并获得认可 , 英伟达终于迎来了业务转机 , 并奠定了之后10年的AI芯片市场绝对霸主地位 , 为业界提供了强大的并行运算能力 。
“Cuda是当时已经濒临破产的英伟达再度崛起不可忽视的推动力 。 ”高精地图公司极奥科技CTO通过历史上一系列相似产品的发展路径总结出一个经验——给硬件找到简单易用的软件接口形态 , 才能在市场中迅速被接受并推广至各个细分领域 。
2019年 , “Cuda之父”柯克博士被美国电气和电子工程师协会(IEEE)授予了协会最高奖项SeymourCray计算机工程奖 , 以表彰他对高性能计算机系统创新的巨大贡献 。
如今我们可以看到 , 英伟达已经在Cuda基础上开发和积累了针对不同领域的大量算法与软件 , 让数不清的开发者不用写一行代码 , 就能先让一套深度学习基础模型跑起来 , 站在巨人的肩膀上升级与优化软件堆栈 。
[格上私募圈]干掉英伟达?
文章图片
Cuda构建的强大生态 , 支持所有主流深度学习框架 , 支持主流云上机器学习训练平台
因此 , 对于许多AI芯片创业公司 , 如果可以支持的深度学习框架都不全 , 能够对接的编程语言也有限 , 也就无法对许多那些已习惯了从基于Cuda的算法库上传和下载算法、通过Cuda架构使用英伟达跨代产品的开发者 , 产生足够的吸引力 。
这相当于 , 当你面对眼前的一堆沙子思考如何设计一堵墙时 , 对手的护城墙不仅已高达数十丈 , 还广招兼职砌墙工 , 并为他们提供云梯和入城资格 。
“国内很多自动驾驶公司 , 用的是英伟达PX2片上系统 , 这个架构最大的好处是方便 。
“譬如直接就能把车道线识别 , 障碍物识别都搭建起来 , 因为相关算法都可以在网上下载完并进行快速部署 , 而且还能做配套的硬件加速 。 而这些算法 , 也是之前开发者上传的训练模型 。 ”
一位不具姓名的自动驾驶技术人士做如上表示 。 他称 , 国内不少人工智能公司就是搭了英伟达的便车发展起来的:“所以你看 , 英伟达一下子占领了两块儿 , 一块儿是训练端 , 一块儿应用端 。 短期内 , 不可能有人撼动他们的地位 。 ”
下一个十年的支撑点
2020年2月 , 美国财经网站MarketWatch用“华尔街为之震惊” , 来形容英伟达2020财年Q4财报上数据中心板块的强势表现——
英伟达的芯片销售额达到创纪录的9.68亿美元 。
这的确是一个令人瞠目结舌的数字 。 要知道 , 2017财年英伟达刚披露这一业务数据时 , 收入为2.8亿美元;此后 , 英伟达的服务器芯片历史销售数据历经跌宕起伏 , 但最好成绩也从未超过8亿美元 。
因此 , 这个数字可以直接向我们证明:数据中心 , 特别是超大型数据中心对人工智能芯片的需求不仅没有放缓 , 反而在加速扩张 。
[格上私募圈]干掉英伟达?
文章图片
从2017年Q4到2020年Q4英伟达各个业务板块的收入变化 。 图片来自商业定量分析机构BusinessQuant


推荐阅读