搜索引擎不仅仅是个问答机器
自 ChatGPT 横空出世,不乏 Google 搜索将被取代的声音 。
其实 Google 并没有掉队,它在 DeepMind 的大型语言模型 Chinchilla 上训练 AI 聊天机器人 Sparrow,也开发了对话神经语言模型 LaMDA 。
去年 5 月,Google 研究人员发了一篇题为「重新思考搜索」的论文,描述了一种新型搜索引擎:大型语言模型借助算法提供简洁的专业答案,用户无需在大量网页列表中搜索信息,听起来就是 ChatGPT 的模样 。

文章插图
为什么 Google 没有像 OpenAI 一样,直接向大众推出类似 ChatGPT 的产品,或者将它集成在自己的搜索之中?Alphabet 工程师@hncel认为,问题主要在于成本和延迟:
像 GPT 这样的大型语言模型是 Google 主要研究的领域之一,Google 有大量预算与人员来处理这些模型,但在最大的 Google 产品(例如搜索、Gmail)中实际使用这些语言模型的经济性还不完全存在 。
发布有趣的测试版是一回事,但将它深入集成到一个每天服务数十亿个请求的系统中,考虑到服务的成本、增加的延迟,则是另一回事 。将成本降低至少 10 倍,才能将这样的模型集成到搜索等产品中 。
与此同时,大型语言模型也会影响 Google 搜索当前的商业模式——Google 母公司 Alphabet 2021 年收入 2576 亿美元,约有 81% 来自广告,其中大部分是 Google 的按点击付费广告 。
【火爆全网的 ChatGPT,还干不掉 Google 搜索】像 ChatGPT 这样的 AI 大大减少了页面数量,阻碍了人们浏览和点击更多广告,那么广告收入也会随之下降 。

文章插图
话说回来,ChatGPT 的爆火,也让我们或多或少地意识到,搜索引擎「索引、检索和排序」的固有模式已经统治了 20 多年,Google 每年都会对搜索引擎进行数千次更改,其中大多数都很微小,并没有发生根本性的变化 。
1998 年,一对斯坦福大学的研究生发表了一篇关于新型搜索引擎的论文:
在这篇论文中,我们介绍了 Google,这是一种大规模搜索引擎的原型,它大量使用了超文本中的结构 。Google 有效地抓取和索引网络,并产生比现有系统更令人满意的搜索结果 。
过去的创新变成了现在的传统,Google 等传统搜索引擎面临的对手不止是未来的 AI 。
比如,已经有人将 TikTok 称作「新的 Google」,国外网友使用 TikTok 搜索,有点像我们在小红书查找攻略,在美食、片单等领域确实好用 。这背后隐藏着一个趋势:在 TikTok 和抖音「称霸」的世界里,互联网比以前更直观、更视觉化、更具交互性,搜索也不例外 。

文章插图
但 TikTok 不至于真的动摇 Google 。如果查找更多信息、访问更多网站,你依然要回到 Google 。
既然变化已经发生,Google 也需要通过更自然、更直观的方式,带来更好的搜索体验 。
近几年来,因为人工智能、机器学习和计算机视觉等方面的进步,Google 一直向这个方向转变,包括引入相机和麦克风搜索、图片和文本的多重搜索、地图中的沉浸式视图等等 。
简单来说,Google搜索的输入和输出,都变得更加「多感官」,也变得更加主动,更能猜中用户的心思 。
机器学习模型 MUM 让 Google 搜索引擎更「聪明」.
许多 Google 与搜索有关的项目仍在探索和测试阶段,今年 9 月的年度 Search On 活动上,负责 Google 搜索产品的副总裁 Liz Reid 举了一个未来可能的例子:
如果 Google 知道你对木工感兴趣,它在回答你搜索的某个问题之外,还会向你展示你不知道的新工具、你从未听说过的 YouTube 博主,以及你可以去哪里学习新技能等等 。
Liz Reid 相信,Google 搜索不仅仅是一个反应快速的问答机器,而是一个用于探索、发现、学习你还没有明确答案的事物的系统 。

文章插图
某种程度上,迭代的搜索引擎也好,进击的通用 AI 模型也罢,一个是固有框架的微调,一个是另起炉灶的改革,它们都在让知识更容易被获取,让信息筛选更加智能,降低你的学习门槛,缩短你的学习过程 。
Google 高级副总裁 Prabhakar Raghavan 提出了一个很有意思的观点,搜索还是一个远没有解决的问题,「如果你把所有的机器都给我,我仍然会被人类的好奇心和认知所束缚」 。
搜索得到更好的答案之前,我们要先知道如何提出问题 。未来,组织资料的能力可能不再稀缺,基于个体经验和情感的提问能力和原创观点更为珍贵 。当你被引到知识的大门前,人之为人的思辨性和创造力,则以前所未有的地位被凸显出来 。
推荐阅读
- 盘点12个Vue 3的高颜值UI组件库
- 为什么选择 AWS 作为“架构完善的框架”?
- 我误解了分布式系统中的可伸缩性
- 建议收藏 聊聊分库分表后非Sharding Key查询的三种方案~
- C++的数据类型
- 浏览器的作用不只是搜索、浏览网页,它还隐藏着这些功能
- 升级B买体验,阿里1688的“批发采购新通路”
- 一生必看的6部韩剧:第1部揭示人间冷暖,第5部简直丧到没人性!
- 李彦宏站台的世界首家AI公园都有啥?怎么去?
- 完整的爱情需要经历4个时期,你们的爱情正处在哪一个时期呢?
