AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造( 二 )


不仅如此,在低延时场景(低于4毫秒的YoloV3检测算法场景)下,载天VA10的推理性能,更达到同功耗市场主流GPU的3倍以上 。
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

也正是得益于载天VA10的如此性能,它便非常适合“上岗”一些需要高实时性的云端AI场景,例如直播视频增强、智慧交通管理、实时语义理解等 。
以智能ROI优化为例,载天VA10的效果如下:
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

不难看出,无论是实时处理效率,亦或是色彩增强效果,载天VA10都是肉眼可见的更胜一筹 。
边缘AI推理加速卡——载天VE1
除了数据中心端,瀚博半导体聚焦在边缘端同样发布了新品,载天VE1 。
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

不同于载天VA10,载天VE1更侧重的发力点,是在那些大算力的需求场景 。
例如车路协同、低速自动驾驶(无人配送车、港口物流园区无人驾驶的车辆)等 。
而载天VE1之所以能够“胜任”于这些场景,还是得益于它自身的性能:
在 40~65瓦功耗下,INT8峰值算力达100TOPS
吞吐率达到主流GPU的2倍,但延时不到主流GPU的5%
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

软件平台VastStream
但也诚如刚才所言,硬件性能上的“单打独斗”并不能将其功力全程发挥出来 。
因此,瀚博半导体对此的破解之道,便是“软硬一体”——VastStream 。
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

据了解,VastStream软件平台,可以加速各类AI应用的部署 。
例如计算机视觉、视频处理、自然语言处理、搜索与推荐、算子自定义扩展等 。
而其全新软件组件,还提供了系统管理等三大管理工具,方便客户部署 。
与此同时,VastStream的基础软件栈功能也变得更加丰富 。
主要特性包括统一接口、灵活调度、通用AI计算、多路高效视频转码+AI增强、易编程快迁移、工具链完备等 。
至此,不难看出瀚博半导体已经出现一条清晰可见的业务线:
芯片、推理加速卡、一体机的硬件产品,再到软件整合的系统解决方案 。
那么对于这位新晋的“GPU玩家”来说,如今也到了回答这个问题的时候:
瀚博要走怎样的一条“GPU之路”?
对于这个问题,钱军其实在现场已经给出了答案:
我们致力于做全球领先的综合算力平台 。
AMD|国产GPU添新玩家 AMD出身 两款业界第一7nm芯片曾由他打造
文章图片

而这次预览的GPU,可以说仅是瀚博半导体完整拼图中的重要一块 。
这一点,从瀚博半导体的发展路径中便可以了解一二 。
钱军在创立瀚博半导体之初,虽然有着数十年深耕GPU的团队,但他们却没有直接切入到造GPU的赛道 。
选择的切入点反倒是“AI+视频”,而且这其中的AI更多的是在推理应用侧 。
之所以如此,是因为钱军认为视频就像一枚硬币,有着2个维度 。
对于已经产生的视频,是一个计算机处理的问题,包括增强、分析等等 。
而对于还未出现的视频,那就是一个像素生产的问题,包括渲染等工作 。
虽然此前瀚博半导体从未官宣过类似SG100这样的GPU的消息,但与GPU相关的能力其实已经是嵌套在了此前的产品中,只是并未对外宣传 。
此举背后的逻辑,就是让产品先用起来,然后再打造一颗独立的高性能GPU 。
加之已有的推理卡、软硬件等,便可把“综合算力平台”的拼图拼完整了 。
然而把“国产GPU”这条线铺开来看,在瀚博半导体之前,已然是一副势头凶猛的态势 。
那么在这样的大环境之下,瀚博半导体正式进入“国产GPU玩家”之列,其所持的杀手锏又将是什么?
对此,钱军表示:
重要的不是只有一个芯片、一个“硬疙瘩”;更重要的是一个软件的生态和合作的生态 。
唯有做到高性能、低成本,然后用起来才是硬道理 。


推荐阅读