百度|百度智能搜索到底有多智能?不可同日而语( 二 )
以搜索引擎技术为核心 , 在过去十余年中 , 百度演化出了语音、图像、知识图谱、自然语言处理等人工智能技术 。这些长期的技术积累 , 甚至在今天进一步拓展到了自动驾驶、AI芯片等领域 。
这也是为什么 , 在今天 , 搜索引擎不仅仅能按照你输入的文字进行搜索 , 甚至直接给一张图、一段音乐 , AI也能理解你想要获取怎样的信息 。
文章图片
正如沈抖所说 , 打开百度App , 你说出想问的问题 , 可能旁边的人还没听清 , 百度搜索已经能够提供精准的答案 。而当你在阿那亚的任何一个角落 , 看到不认识花草苗虫 , 打开相机使用视觉搜索 , 也能快速得到答案 。
智能搜索时代背后的关键技术
所以 , 进化到智能搜索时代 , 让搜索引擎高效连接你和信息的核心技术 , 具体又有哪些?
正好 , 在百度万象大会上 , 沈抖也介绍了百度AI是如何推动搜索持续进化的 。我们一项一项来看个仔细 。
文章图片
深度语义匹配模型
2013年 , 百度搜索就上线了基于百亿级用户行为数据的SimNet语义匹配模型 , 使得搜索结果的相关性得到明显提升 。
简单来说 , SimNet利用词向量技术解决了关键词匹配失败的问题 , 可以有效得到同义词、近义词之间的相似度 , 并且具有较强的泛化能力 。
在实际应用场景下 , 海量的用户点击行为数据会被转化为大规模弱标记数据 , 再搭配并行训练算法 , SimNet首次实现了可完全取代基于字面匹配的策略 , 而且可以直接建模非相似度类的匹配问题 。
其核心网络结构形式 , 包括BOW、CNN、RNN、MMDNN等 。
文章图片
而基于这样的深度语义模型 , 百度搜索已经将一次全库语义检索的时间优化到了10ms 。
跨模态深度阅读理解技术
前文也说到 , 有AI加持的搜索引擎 , 不仅仅能读懂文字 , 还能听懂语音、看懂图片 。
其实 , 机器认知世界的方式 , 也不仅仅局限在自然语言 , 还包括对语音、视觉等多模态信息的综合应用 。
为此 , 百度重点研发了知识增强的跨模态深度语义理解技术 。
文章图片
一方面 , 打造拥有超过50亿实体和5500亿事实的多元异构知识图谱 。通过将知识作为背景信息 , 增强了模型的语义推理能力 。
另一方面 , 通过知识关联跨模态信息 , 运用语言描述不同模态信息的语义 , 进而让机器实现图像和语言、语音和语言的一体化理解 。
基于这项阅读理解技术 , 百度还在EMNLP-MRQA 2019阅读理解国际测评中 , 以超出第二名近2个百分点的优势获得冠军 。
智能化多模搜索技术
2015年 , 百度就提出了多模搜索的理念 , 探索从文本搜索向语音、视觉、视频等多模态搜索的演进 。
而这或许也是智能化搜索在用户层面最直观的体现——在百度App中 , 你可以体验语音搜索、拍照搜索、实时翻译、植物识别、视频搜索等丰富的搜索方式 。
除了前面提到的跨模态语义理解 , 在语音搜索上 , 百度搜索还集成了语音识别、语音合成等多项AI技术 , 让搜索引擎能“听”会“说” , 不仅能够听清、听懂 , 还能深入理解语义 , 给出绘“声”绘色的最佳搜索答案 , 让搜索引擎与用户之间的交互方式变得更加自然、流畅、便捷 。
在视觉搜索上 , 百度搜索综合了图像识别、人脸识别、OCR、物体检测、实体匹配等多项视觉技术 , 并依托于搜索系统对全网图像、视频内容的索引以及用户行为 , 得以细粒度的识别用户实时录制的视频流、拍照及上传图片中的实体和文字 , 进而围绕实体在用户视觉场景下的需求 , 链接并组织相关内容及服务提供给用户 , 实现诸如拍题搜索、商品搜索、实时翻译、植物识别等智能视觉搜索能力 。
推荐阅读
- 特斯拉|中美智能化博弈 特斯拉失守!国产新车小鹏P5险胜Model 3
- 智能手机|网友分享手机简易“防盗”秘技 设置特别通信录引发热议
- 笔记本|DNA里的原罪?笔记本厂商进军智能手机为何屡战屡败
- 智能手机|蔚来“造手机”详情曝光:原美图总裁负责、小米宣布造车前就在规划
- 智能手机|已在调研阶段?蔚来回应进军手机行业:目前没有可供披露信息
- 智能汽车|135亿!果链巨头立讯精密拟巨额定增:涉智能汽车、消费电子等
- 人工智能|中国式浪漫之外的北京冬奥:这位北京大妞最让人想不到
- 智能手机|2021年Q4全球智能手机收益份额排名:苹果第一 小米第三
- 汽车|汽车高速断电无法启动!车主竟下车推车:百度上学的
- 微软|Windows 11搜索速度大提速:终于不再鸡肋了
