百度|百度智能搜索到底有多智能?不可同日而语

u1s1是什么意思?干饭人又是个啥?
百度|百度智能搜索到底有多智能?不可同日而语
文章图片
当在北戴河阿那亚的剧场里被突然问到类似稀奇古怪的问题 , 一时发懵的我只想当场掏出手机 , 给对方来个“百度一下” 。
说起来 , 搜索这项“旧技术”最近的讨论声浪还真有点大 。
君不见那边新搜索工具广告天天见 , 这厢听着海风看话剧的百度万象大会现场 , 老牌搜索引擎也打出了“百度一下 生活更好”的新Flag 。
百度|百度智能搜索到底有多智能?不可同日而语
文章图片
其实 , 正如百度集团执行副总裁沈抖现场所说 , 大家对搜索太过熟悉 , 以至于感受不到其中技术的变革 , 搜索的技术存在感那是真“感知不强” 。
但实际上 , “AI技术为搜索提供了持续进化的动力” 。
要知道 , 从古早的文本检索到今天的人工智能 , 网络世界的网页数量已经从千万级别 , 增长到了千亿级别 , 其中囊括的内容可能比世界上所有图书馆加起来还要丰富 。
在今天 , 想要高效连接今天的互联网用户和海量信息 , 搜索引擎其实真的没那么简单 。
那么 , 究竟是怎样的技术在驱动搜索引擎更智能地读懂你的需求 , 连接丰富而又准确的信息?
技术本身在海量信息增长面前 , 又经历了怎样的进化?
今天 , 不如就借着这阵势 , 我们来好好说道说道 。
从文本检索到人工智能
现在 , 在使用搜索引擎时 , 你可能不只会用几个关键词 , 还会直接输入你想问的问题 。
百度|百度智能搜索到底有多智能?不可同日而语
文章图片
但其实早期的搜索引擎采用的是文本检索的方式 , 只能做到用户查询关键词和网页文本内容的匹配 。
可想而知 , 虽然这样的方式也能把不同网页的关联度进行排序 , 但总体的搜索质量是比较差的 。
而实际上 , 网页之间有着丰富的链接关系 , 就像高引论文往往本身质量更高 , 高质量的网页通常也会被更多的网页链接 。
为了进一步挖掘和利用这种链接信息 , 1996年 , 李彦宏开发了Rankdex , 即超链分析算法 。这是世界上首个使用超链接来衡量网站质量的搜索引擎 。
也就是说 , 搜索引擎在收到一个用户查询之后 , 不仅仅会去匹配网页的内容 , 还会看看其他网页对这个页面的“评价” 。
在此之后 , 谷歌也提出并使用了类似的PageRank技术 , 并大获成功 。
超链分析算法 , 可以说是当今每个主要搜索引擎排名算法的基础 。值得一提的是 , 在谷歌创始人拉里·佩奇的第一项网页排名专利申请中 , 也引用了Rankdex 。
如果说早期的搜索技术门槛不算高 , 从超链分析这个阶段开始 , 一些今天大家伙普遍依赖的搜索引擎 , 就开始一骑绝尘 , 拉开差距了 , 比如谷歌 , 比如百度 。
并且这些做搜索引擎起家的公司 , 如今也都成为了人工智能领域的先行者 。
百度|百度智能搜索到底有多智能?不可同日而语
文章图片
而事实上 , 甚至在人工智能未成显学之时 , 为了让搜索结果更快、更精准、更个性化 , 搜索领域的巨头们就已经着手将机器学习的方法引入到搜索引擎中 。
谷歌就在2016年上线了基于反向传播技术的RankBrain算法 。该算法可以基于语义分析和词库联想 , 帮助用户更快地搜索冷门的搜索结果 。
而如今在NLP领域大火的BERT , 也已被部署到谷歌搜索当中 。有了预训练语言模型的加持 , 即使你输入的是一大段文字 , 搜索引擎也能够get到你想查什么 。
根据谷歌的数据 , BERT的引入为至少10%的搜索结果带来了改善 。
国内 , 百度同样是最早投入人工智能技术研发的科技公司 , 在2010年就成立了单独的NLP部门 。


推荐阅读