Intel|谷歌自研芯片 替代上千万颗英特尔CPU
伴随着新兴应用的兴起以及数字化程度越来越高,已有的成熟处理器在性能、效率以及成本上的优势相较自研芯片的优势越来越小,因此借助成熟的第三方IP以及EDA工具和代工厂,科技巨头们纷纷开始自研芯片,其中最有代表性的就是谷歌TPU,除此之外,谷歌Argos VCU也值得关注 。
文章图片
谷歌设计了自己的新处理器Argos 视频(转)编码单元 (VCU),其目的只有一个:处理视频 。高效的新芯片使这家技术巨头能够用自己的芯片替换数千万颗英特尔 CPU 。
多年来,英特尔内置于其CPU中的视频编解码引擎一直主导着市场,因为它们提供了领先的性能和功能,并且易于使用 。但是定制的专用集成电路 (ASIC) 的性能往往优于通用硬件,因为它们仅针对一种工作负载而设计 。因此,谷歌转而为YouTube的视频处理任务开发自己的专用硬件,并取得了很好的效果 。
不过,英特尔可能会利用其最新技术来赢回谷歌的专业视频处理业务 。
谷歌为什么自研VCU?
数据显示,用户每分钟向YouTube上传超过500小时的各种格式的视频内容 。Google需要将该内容快速转码为多种分辨率(包括144p、240p、360p、480p、720p、1080p、1440p、2160p和4320p)和数据高效格式(例如,H.264、VP9 或 AV1),这需要强大的编码能力 。
过去,谷歌有两种转码/编码内容的选择 。第一个选项是英特尔的视觉计算加速器(VCA),它包含三个Xeon E3 CPU,内置Iris Pro P6300/P580 GT4e集成图形内核和先进的硬件编码器 。第二种选择是使用软件编码和通用英特尔至强处理器 。
谷歌认为,对于YouTube的工作负载来说,这两种选择都不够节能 。视觉计算加速本身就相当耗电,而至强CPU的数量本质上要增加服务器的数量,这意味着额外的功率和数据中心占用空间 。因此,谷歌决定采用自研的定制硬件 。
谷歌的第一代 Argos VCU 并没有完全取代英特尔的CPU,因为服务器仍然需要运行操作系统并管理存储驱动器和网络连接 。在很大程度上,谷歌的Argos VCU就像一个总是需要一个CPU的GPU 。
文章图片
谷歌的VCU与GPU中的流处理器不同,它集成了10个H.264/VP9编码器引擎、几个解码器内核、4个LPDDR4-3200内存通道(具有 4x32 位接口)、1个PCIe接口、1个DMA引擎和1个用于调度目的的小型通用内核 。
VCU除了自研的编码器/转码器外,大多数IP都从第三方获得许可,以降低开发成本 。每个 VCU还配备了8GB的可用ECC LPDDR4内存 。
实际上,谷歌研发VCU的理念是将尽可能多的高性能编码器/转码器放入单个硅片中(同时保持节能),然后将VCU的数量与所需的服务器数量分别扩展 。谷歌在一块板上放置两个 VCU,然后在每个双插槽英特尔至强服务器上安装10个卡,大大提高了每个机架的解码/转码性能 。
VCU加速替代CPU
谷歌表示,与英特尔Skylake驱动的服务器系统相比,其基于VCU的设备在性能、TCO(总体拥有成本)、计算效率方面实现了7倍(H.264)和高达33倍(VP9)的提升 。这样的提升带来的成本优势(VCU与英特尔的 CPU 相比),使得 VCU 成为视频巨头YouTube的更好选择 。
文章图片
CPU、GPU 和配备 VCU 的系统离线双通道单输出 (SOT) 吞吐量
从谷歌分享的性能数据看,很明显单个Argos VCU仅比H.264 中的2路Skylake 服务器CPU快 。但是,由于可以在单个服务器中安装20个VCU,从效率的角度来看,VCU胜出 。但对于要求更高的VP9编解码器,谷歌的VCU似乎比英特尔的双路至强快五倍,有令人印象深刻的效率优势 。
自从谷歌拥有Argos VCU,它用自己芯片取代了许多基于至强的YouTube服务器 。很难估计谷歌实际更换了多少至强系统,但一些分析师认为,这家科技巨头本可以将3300-4000万个英特尔CPU换成 自己的 VCU,即使第二个数字被高估了,单位仍然是数百万个 。
由于谷歌的其他服务需要大量处理器,因此该公司从AMD或英特尔购买的CPU数量可能仍然非常高,并且不会很快减少,因为谷歌自己的数据中心级芯片的使用需要数年时间 。
还值得注意的是,目前谷歌为了尝试使用创新的编码技术(例如,AV1),YouTube 需要使用通用CPU,因为Argos不支持新编码技术的编解码 。此外,随着更高效的编解码器的出现,这些编解码器对计算能力的要求往往更高,谷歌将不得不继续使用 CPU 进行部署 。
推荐阅读
- AMD|AMD Yes降温!Intel重新夺回x86处理器市场:12代酷睿太猛
- 苹果|解决信号差!苹果最重要芯片曝光:iPhone 15要首发自研基带
- Intel|Intel Evo规范进化第三版:100多款笔记本、首次折叠屏
- Intel|Intel 12代酷睿低功耗P/U系列正式发布:轻薄本超过250款
- OPPO|OPPO Find X5系列来袭:自研芯片加持 影像王者预定
- AMD|Intel 12代酷睿单核性能霸榜前十 AMD跌出25名:只能靠Zen4挽回了
- 真我|realme全球首发150W闪充!老外喊话苹果谷歌
- Intel|Intel 15代酷睿核显爆发:台积电3nm+320单元、目标直指苹果
- Intel|Intel 15代酷睿核显爆发:台积电3nm+320单元、重夺苹果芳心
- Intel|Intel Arc锐炫显卡全部亮相:能效超高!
