[人工智能]AI芯片的一些科普( 六 )
本文插图
图3:节点转换经济性
计算密集型人工智能算法受到芯片成本和速度的瓶颈制约 。
人工智能公司在人工智能相关计算上花费的时间和金钱已经成为人工智能发展的瓶颈 。 鉴于先进节点AI芯片比落后节点AI芯片或先进节点CPU更具成本效益且速度更快 , 因此这些AI实验室需要先进节点AI芯片来继续推进AI进展 。
第一 , 人工智能实验室DeepMind领先的人工智能实验 , 如AlphaGo、AlphaGo Zero、AlphaZero和AlphaStar的训练成本 。 估计每项费用为500万至1亿美元 。 一个成本模型显示 , AlphaGo Zero的训练成本为3500万美元 。 人工智能实验室OpenAI报告称 , 在2017年2800万美元的总成本中 , 有800万美元用于云计算 。 将这些计算成本乘以30 , 用于trailing node AI芯片 , 或甚至更多用于先进节点CPU , 会使这种实验在经济上变得不可行 。 一些人工智能公司的计算成本增长如此之快 , 可能很快就会达到成本上限 。 从而需要最高效的人工智能芯片 。
其次 , 领先的人工智能实验可能需要几天甚至一个月的时间进行训练 。 虽然部署了关键的人工智能系统 , 但通常需要快速或实时推理 。 通过使用trailing node的AI芯片或引导节点的CPU来增加这些时间 , 将使得AI研发所需的迭代速度和部署的关键人工智能系统慢得令人无法接受 。 一家芯片速度较慢的公司可以尝试通过并行使用大量速度较慢的芯片来支付巨大的能源成本以提高速度 。 但这一策略可能会失败 , 原因有二 。 首先 , 正如附录A 的A节所讨论的 , 领先的实验需要人工智能研究人员调整人工智能算法 , 以支持更多的数据和模型并行性 。 人工智能研究人员可以在有限的程度上做到这一点 。 但如果试图并行使用比目前领先的人工智能实验所使用的更多数量的人工智能芯片 , 可能会面临困难 。 另一方面 , 即使在算法上可行 , 这种并行也需要互补的软件和网络技术来实现 。 并行扩展数百或数千个GPU是极其困难的 , 如果扩展更大数量trailing node的GPU , 可能会比以及当前的能力 。
新的Cerebras晶圆级引擎芯片为网络技术提供了一个有趣的潜在解决方案 。 它是第一个晶圆级芯片 , 比其他任何人工智能芯片的表面积都大得多 。 这意味着可以在单个芯片上实现很大程度的并行性 , 减少多个芯片之间对先进网络技术的需求 。
对这一分析的警告是 , 最近的一些人工智能突破并不需要大量的计算能力 。 此外 , 正在进行的研究是开发需要最少训练的人工智能算法(例如"几次射击"学习技术) 。 对于这些人工智能算法 , 将小成本或速度乘以大数字仍可能产生小成本或速度 。
美国和中国的AI芯片竞争
最先进的AI芯片对于高级AI系统是必不可少的 。 美国及其盟国在生产与AI芯片相关的半导体领域中具有竞争优势 。 美国公司主导着AI芯片设计 , 其中包括用于设计芯片的电子设计自动化(EDA)软件 。 中国的AI芯片设计公司落后于美国 , 他们需要依靠美国EDA软件来设计其AI芯片 。
美国 , 中国台湾和韩国公司控制着大多数可以制造最先进的AI芯片的晶圆代工厂(“ fabs”) , 尽管一家中国公司最近获得了一小部分市场占有率 。 但是 , 中国的AI芯片设计公司大都将制造外包给了非中国大陆的fab , 因为它们的产能更大 , 而且制造质量更高 。
领先的节点AI芯片的成本效益和速度从政策的角度来看很重要 。 美国公司主导了人工智能芯片的设计 , 而中国公司在人工智能芯片设计上远远落后 , 依赖美国EDA软件设计人工智能芯片 , 需要美国和盟国的中小企业和晶圆厂根据这些设计制造人工智能芯片 。 最先进的人工智能芯片的价值 , 加上它们的供应链集中在美国及其盟国 , 为美国及其盟国提供了一个杠杆点 , 以确保人工智能技术的有益开发和采用 。
推荐阅读
- 第一财经|AI芯片独角兽来了!寒武纪“闪电”过会,拟募资28亿元
- cnBeta|惠普今天发布多款笔记本电脑和一些外设产品
- 互联网的一些事|QuestMobile:2020 移动互联网人均使用时长同比增长 12.9%
- 微视观|年度旗舰华为Mate40X来了 芯片拍照功能全面升级
- |界读丨铁娘子董明珠豪掷20亿助华为研造''芯片'' 要做世界第二
- 三易生活|AMD也要做5G手机芯片?可能目前只是个幻想
- 厦门名记|背靠小米、华为,中国巨头喜提全球第一,靠卖芯片年赚23亿
- 大哥大短讯|华为Mate40系列参数基本确认,麒麟芯片性能强劲,各项硬件大升级
- 生活海风说|联发科驳斥“华为借联发科迂回采购台积电芯片”的报道
- 网易科技报道|日媒称华为或借联发科采购台积电芯片 联发科怒批
