半年大模型,还在天上飞( 二 )


一类值得参考的案例是依托自身产品生态而打造的垂类to C模型 , 例如知乎早早宣布于产品内进行内测的知海图AI以及前不久才发布的携程问道 。
两者切入大模型赛道的优势并无二致 , 在于自有的社区生态和以此为基础衍生的高质量社区内容 。而内容作为行业数据 , 在简单清洗后便可成为大模型的训练语料 。两者的细微差别则是知乎自始便是内容社区 , 而携程则是近年才开始发力做内容 。
可是就目前来看 , 无论是知乎还是携程 , 其大模型的产品形态似乎都未能切中用户痛点 , 亦未能对既有功能有足够的提升 。
知海图AI目前已公布的产品“热榜摘要”是通过AI抓取优质问答并润色改写出梗概呈现给用户 , 而另一项应用“搜索聚合”则是自回答中聚合观点 , 提高用户获取信息、形成决策的效率 。
本身推荐、热榜一类聚合功能便是知乎“传统艺能” , 大模型赋能后的表现在用户层面并未掀起水花 。况且 , AI改写润色的流程也将热门答案的个性化特征覆盖 , 于用户而言 , 这项应用的功能仅在于快速了解信息 , 这与内容社区所倡导的差异化、个性化交流背道而驰 。
而立足OTA的携程问道 , 在携程董事局主席梁建章看来是一个旅游业的“可靠答案库” 。其产品成效如何还需时间检验 , 但自定位来看 , 同样有“舍本逐末”之嫌 。
旅游在年轻用户眼中本就不存在标准答案 , “特种兵式”、“打卡式”、“沉浸式”等多样化旅游形式的出现证明了这一点 。如假设大量用户通过AI制定旅游路线规划 , 千篇一律的路线规划反而会影响社区交流与氛围 , 甚至遭致用户停留时间的下降 。
大体看来 , 垂直模型在C端的落地尝试算不上顺利 , 甚至有成为“沉没成本”的可能 。或许受到大模型本身“提高效率”神话的影响 , 产品定位也大多囿于“效率”二字 , 只是效率仅仅是用户体验中一个不算核心的维度 。
相同的范式在to B领域也有所展现 , 而在追求效率的B端 , 行业大模型的商业模式与落地问题得到了更深刻的展现 。
摸不清的黑匣子
“AI不是物理 , 很少有理论上的重大技术突破 , 更多的是在模型结构、数据质量等维度做微调和小优化 , 甚至很多时候模型输出更好了 , 团队却找不到原因 。”
在一位业内人士看来 , 大模型在业内外存在巨大的认知偏差 , 而原因则在于大模型训练以及AI行业对于外界而言是一个不折不扣的“黑匣子” , 很难审视大模型产生输出结果的推理过程 , 它看不见摸不着 。
这导致外界在度过ChatGPT带来的狂热期后 , 一旦冷静下来 , 便会对大模型这个“黑匣子”持审慎态度 。这将导致大模型在落地上的困境 , 而这一现象在如今向to B路线转变的过程中更为明显 。
以如今已明确to B路线的大厂出品为例 , 包括腾讯云推出的MaaS技术方案、华为云推出的盘古大模型等 , 依靠自身云计算生态 , 均称其大模型服务支持多样化部署 , 包括云端部署、本地化快速部署等 。在交互、操作、后续加入新的行业数据迭代优化等方面也有建树 , 可以说是为了落地 , 把大模型的门槛降到了极低 。
但“审慎”带来的认知墙还是没有打破 , 即使ChatGPT的风吹了半年 , 许多企业没有动力也没有兴趣去研究如何导入大模型 。
数年前的云计算行业可以看到因循的相似逻辑 。云计算是在认识到数据价值后 , 以此为基础的服务和衍生 , 至于大模型于企业的价值 , 相对而言更是数据价值的跃升 。同样是企业客户缺乏的技术能力 , 连云计算在国内企业的普及之路都距终点尚远 , 大模型自不必说 。
行业大模型究竟好用与否 , 其实已经并不重要了 , 毕竟商品的使用价值最终还需使用者来挖掘 。更有甚者 , 外界会粗暴通过某些测试、表现来衡量模型水平 , 例如“松鼠鳜鱼法”或近来因预测特大台风“杜苏芮”的登陆地点与强度有错误现象而遭受质疑的华为盘古气象大模型 。


推荐阅读