作为国内首个发布大模型的互联网大厂 , 百度也在人工智能大会上公布了“文心一言”最新进展 。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰称 , 文心大模型3.5效果、功能、性能全面提升 , 实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等 , 模型效果提升50% , 训练速度提升2倍 , 推理速度提升30倍 。
卷算力
与三四月份人们充满期待的科幻想象相比 , 当下做大模型的人 , 关注的话题更接近现实 。他们发现 , 数据是难题 , 算力也是难题 , 大模型这条路 , 前景美好但现实艰难 。
华为目前正在着手解决算力问题 。7月6日 , 华为宣布旗下算力解决方案昇腾AI集群全面升级 , 集群规模从最初的4000卡集群扩展至16000卡 , 为业界首个万卡AI集群 。此前 , 腾讯云也面向大模型发布新一代高性能计算集群 , 算力性能较前代提升高达3倍 。
不过 , 当前的算力仍有很大挑战 。一位大模型创业公司人士表示 , 大模型的研发成本非常高昂 。仅算力一个领域 , 做训练、推理、数据处理 , 就需要数千卡并行的能力 , 这是一套非常复杂、也非常费钱的系统工程 。
算力之外 , 还有其他挑战 。一位做智能汽车的创始人苦恼于数据量太大 , 他们公司刚卖了1万辆汽车 , 但产生的数据已让他觉得很庞大了 , 他不敢想象卖到10万辆车时会怎样 。硬币的另一面 , 也有人因为数据不够而感到困难 , 一位用大模型做生物医药研发的人士说 , 他们最缺的就是数据 , 这阻碍了他们研发医药的速度 。
腾讯高级执行副总裁汤道生表示 , 通用大模型一般基于公开信息来训练 , 在许多专业知识和行业数据积累不足 。在策略上 , 通用大模型有点像“把大海煮沸” , 不够聚焦 , 可以解决80%的问题 , 但未必能够满足企业某个场景的具体需求 。
除此之外 , 清华大学智能产业研究院院长、中国工程院院士张亚勤提到 , 当下大模型仍有自己的局限性 。比如ChatGPT会有时效性问题 , 你问它是什么时候发布的 , 它不知道 , 因为它使用的是2021年9月前的数据 。另外 , 大模型还有效率低、涉嫌侵犯隐私和知识产权保护问题等 , 这些问题都将影响大模型的商用 。
纵深
落地之路面临诸多阻碍
作为一项仍未完全成熟的技术 , 行业大模型的落地之路仍面临诸多阻碍 。
一方面是监管仍待落地 。几乎所有的大模型产品都还没有全面开放API接口服务 , 如百度、阿里就只供定向邀约客户使用 。在接受采访人员采访时 , 科大讯飞总裁吴晓如指出 , 目前在互联网或者公开的开放平台上 , 还需要等到监管机构发牌以后 , 大模型才能正式运作 。“目前很多开发者只能通过预体验的形式 , 将他们的应用和我们的系统进行对接 。”
与此同时 , 有大模型销售人员透露 , 目前不少前来接洽的企业都有着相似的顾虑 , 其中就包括大模型的不稳定问题 。
在世界人工智能大会大模型展区待了大半天、刷遍所有公司推出的大模型应用产品的工程师李捷也有同感 。他所在的通信公司想借助大模型实现业务端问答场景的落地 , 但从这半天的试用结果来看并不乐观 。
对于C端用户而言 , 大模型一本正经胡说八道的“机器幻觉”也常被调侃 。但如果要接入金融、医疗、工业制造等严肃B端场景 , 这一潜在风险就可能造成经济损失或直接威胁生命安全 。
“大模型最大的不足就是‘幻觉’ , 正式商用是不允许有‘幻觉’的 。”在头部自动驾驶厂商担任技术经理的张启强调 。
市场的另一个关注重点是大模型的数据安全问题 。高质量的数据是助力AI训练与调优的关键 , 足够多、足够丰富的数据 , 是生成式AI大模型的根基 。
据《机器之心》报道 , 绝大部分企业不可能把敏感的内部数据上传 , 比如产品设计、技术架构、核心代码、制造工艺、配方、客户隐私、会议纪要、战略文档、业务规划、商业逻辑等 , 一定要保留在内部 , 特别是对于国企央企、金融、能源、大型集团企业、先进制造等数据敏感性较高的行业而言 。
推荐阅读
- 闹大了!曝刀郎歌曲被下架,网友怒而疯狂卸载,酷狗官方回应来了
- 光腚出镜下衣消失术,床单走红毯,70岁装少女,这些女星为博眼球太疯狂!
- 毕福剑香港罕见曝光:与汤镇业梁小龙参加活动,站C位被观众疯狂围堵
- 五八同城倒卖应届生简历,疯狂践踏用户隐私?
- 大模型速度狂飙2.39倍!清华联手微软首提SoT,让LLM思考更像人类
- 把大模型装进手机,分几步?
- 芦荟为什么一晒太阳就变色 芦荟叶子干瘪向内卷怎么挽救
- 国产AI大模型哪家强?十大维度横评四款主流大模型!
- 网易胡志鹏:从游戏到产业,AI大模型价值正显现
- 清华发布SmartMoE:一键实现高性能MoE稀疏大模型分布式训练
