AI十年浮沉,与改变命运的大模型( 三 )


大模型的这一价值 , 几乎吸引了全球所有的目光 。连早已退休、专心搞慈善的比尔盖茨 , 都为此兴奋不已 。他在一篇文章中写道 , 自己有幸亲历了人类可能最重要的两场革命的开端:第一次发生在windows萌芽、PC市场刚刚兴起的80年代 , 而第二次正是去年——大模型刚刚开始涌现的时候 。
而沈抖认为 , 作为“通才”的大模型还催生一种全新的产业化路径:MaaS(Model as a Service) , 模型即服务 。“根据我们提供的文心一言的大模型服务 , 企业能够以此为基础 , 结合他们所在行业去微调出一个行业大模型 , 再用这个行业大模型去服务整个行业 。”
未来 , 大模型可能会成为一个类似于Android/ target=_blank class=infotextkey>安卓的“超级底座” ,  每个行业都迎来AI再造的机会 , 并给应用端带来大量的机会 。
而在美国 , 已经诞生了依托于大模型开展业务的独角兽 。在德克萨斯州 , 一家初创企业凭借微调后的AI应用 , 在短短18个月时间做到了15亿美元估值 , 年收入已有3000万美元 , 比直接做大模型的企业还赚钱[10] 。
不过 , 产业化潜力仅仅是大模型价值的一个方面 。不同于过去两年流行的元宇宙、Web3等概念 , 大模型带来了实打实的生产力提升 。
例如长安汽车在参与百度文心一言的邀测时 , 就体验了一回大模型的生成PPT功能 。过去 , 制作一份PPT通常要花费半天甚至一天时间;如今 , 只需三分钟即可做出一份内容齐全、格式精美的PPT 。未来 , 机械的重复性工作将完全可以交给AI , 员工可以集中于创造更大价值的工作 , 企业竞争力增加同时增加社会财富 。

AI十年浮沉,与改变命运的大模型

文章插图
百度智能云举行的闭门沟通会上 , 现场演示文心一言生成PPT
毫无疑问 , 大模型将是未来十年科技圈最重要的叙事之一 。
百模大战
“百模大战”来了 , 一如当年的“百团大战” 。
国内大公司纷纷扎堆推出大模型 , 百度文心一言最先 , 360、腾讯、阿里、商汤、科大讯飞、字节等纷纷紧追 。大模型产品大多同时兼具对话问答、文章创作、代码写作等多项技能 。市场上供给多了 , 但这些产品的“智力”水平却参差不齐 , 如何挑选成为了一个难题 。
目前主流观点认为 , 可以有以下两个标准:
第一 , 从芯片到框架、模型再到应用的全链路环节都具备极为优秀的性能 。
芯片决定了算力 , 这是AI训练的基础 。OpenAI曾做过一笔测算:2012年开始 , 全球AI训练所用的计算量平均每3.43个月便会翻一倍 , 远超摩尔定律 。在肉眼可见的未来 , “算力不足”都将会是制约AI发展的最大因素 。因此 , 芯片要做到性能过硬 。
只有制造出算力极强的高端芯片 , 才能满足智算时代的计算需求 , 让云好用 , 这是基础条件 。
而在框架和模型层面 , 软件适配程度要更高 , 算法积累足够 , 大模型能力要更强 。深度学习框架需要做到全栈自主可控 , 推动大模型不断迭代升级 。在此基础上 , 推出多样云服务使得大模型适应各产业的数字、智能化需求 , 做好模型即服务(MaaS) 。
第二 , 能为大家提供全链路的服务保障 。
服务商不仅要具备多元的能力 , 还需要将它们有机地结合起来:如此一来不仅能带来更高的可靠性、帮助企业降本增效 , 还降低AI使用门槛 , 既易用 , 又好用 。
好的智算基础设施 , 就是要高效解决算力、算法、数据处理等多维度的问题 , 而且这些维度之间不是独立存在的 , 而是互相依赖 , 相互优化、紧密耦合 , 从而提升整体基础设施效能 。
比如芯片解决算力问题 , 框架解决算法开发问题 , 大模型解决模型泛化问题 , 他们三者就犹如三人四足比赛中的团队合伙人 , 只有彼此心有灵犀、协调互补 , 才能打出完美的团队配合 , 赢得比赛胜利 。


推荐阅读