|十年育林,百度NLP已枝繁叶茂( 三 )


2014 至 2017 年间 , 基于互联网大数据和搜索应用 , 百度知识图谱技术发展非常迅速 。 2016 年 , 百度构建了全球最大的知识图谱 , 拥有数亿实体、数千亿事实 。 2017 年 , 基于知识图谱技术突破和产业化应用 , 百度 “知识图谱技术及应用” 项目获得“中国电子学会科技进步一等奖” 。
此后 , 面向实际应用场景 , 百度系统地拓展了多源异构知识图谱的研发与应用 。 针对不同的应用场景和知识形态 , 构建了关注点图谱、事件图谱、多媒体图谱、行业知识图谱等多种图谱 。 从认知深度、信息宽度和领域广度多维度对实体图谱进行了系统性的拓展和升级 。 在领域广度方面 , 则从通用领域拓展到涵盖医疗、法律等行业在内的具有强知识性的专业领域 。
特别地 , 在医疗领域 , 基于知识图谱技术的辅助医疗决策等产品目前已在全国 300 多家医院、1500 多家基层医疗机构规模化落地应用 。 相关产品荣获 2019 年全国医疗人工智能应用创新奖 。 2019 年 7 月 , 在百度开发者大会上首次发布了“行业知识图谱平台” , 整合知识图谱构建、存储、问答、推理等技术能力 , 为行业知识的获取与应用提供一体化解决方案 。
此外 , 早在 2011 年 , 百度就着手研究基于知识的语言解析 。 2012 年 , 百度研发了基于海量数据训练的神经网络深度语义匹配框架——SimNet 。 该框架率先将语义表示与匹配计算统一在一个端到端的神经网络模型里 , 并结合中文语言特性融合了多粒度知识 , 支持千亿规模真实搜索点击数据训练 。
去年 , 百度先后发布了知识增强的语义表示模型 ERNIE 和持续学习语义理解模型 ERNIE 2.0 。 2019 年 12 月 , ERNIE 在国际权威的通用语言理解评估基准 GLUE 上首次突破 90 大关 , 超越人类三个点 , 获得全球第一 。 今年 3 月 , 在全球最大规模的国际语义评测 SemEval 上 , ERNIE 获得 5 项世界冠军 。 在刚刚落下帷幕的世界人工智能大会 , 百度文心(ERNIE)知识增强语义理解技术与平台获得了大会最高荣誉奖项“卓越人工智能引领者”(SAIL)奖 。
|十年育林,百度NLP已枝繁叶茂
本文插图

这些突破的取得 , 都离不开百度在相关方向上的前瞻布局和持续投入 。
多模态语义理解
多模态语义理解是解决复杂场景智能化应用的关键技术 , 近年来备受关注 。
2010 年左右 , 科技产业处在迅速的变化之中 , 人们对信息媒介的需求已不仅仅局限于文字 , 而是向语音、图像等多个方向扩展 。 于是 , 几乎在成立 NLP 部门的同一时期 , 王海峰就已开始着手布局语音技术和视觉技术 , 牵头组建了当时的“多媒体部” 。
这一决定是非常具有前瞻性的 。 因为当时 , 除了与搜索强相关的 NLP 业务 , 早期百度并没有太多相关的智能技术需求 。 在多媒体部成立的初期 , 很多人也不知道这些技术有什么用 。
凭借在语音、视觉、语言与知识等领域多年的技术积累与融合 , 2018 年百度发布了以 “多模态深度语义理解” 为核心的百度大脑 3.0 。 百度大脑是百度 AI 核心技术引擎 , 包括视觉、语音、自然语言处理、知识图谱、深度学习等 AI 核心技术和 AI 开放平台 。 如今 , 百度大脑已经向所有开发者开放了 260 多项 AI 能力 , 其中包括机器同传、拍照翻译、文档解析、图文审核、视频分类、对话情绪识别、图文转视频等融合文本与语音、视觉技术的能力 。
今年 , 百度在多模态语义理解上取得新突破 , 提出了知识增强的视觉 - 语言预训练模型 ERNIE-ViL 。 ERNIE-ViL 首次将场景图知识融入多模态预训练, 刷新了 5 项多模态任务纪录 , 并登顶权威榜单 VCR 。
除了这些之外 , 近年来 , 百度 NLP 还在语义计算、阅读理解、多轮对话、机器翻译、开放平台与数据等方向取得了突破性进展 , 并实现了大规模产业化应用 。


推荐阅读