百度百度一口气亮出NLP十年积累:完整技术布局全面披露


鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
十年 , 从名不见经传到世界舞台中央 , 中国NLP经历怎样的历程 , 未来又将向何处去?
ACL首任华人主席、百度CTO王海峰说:站在百度的角度 , 过去到未来 , 语言与知识布局始终要把握两大趋势——技术前沿与产业发展 。
百度百度一口气亮出NLP十年积累:完整技术布局全面披露
本文插图
作为国内最早设立NLP研发部门的企业 , 百度可以说是中国NLP十年「披荆斩棘」的全程参与者、见证者 。
自2010年起 , 百度就已经将NLP研发部门从各个业务线中独立出来 , 一面攻坚前沿技术 , 一面追求业务落地 。
如今 , 十年技术积累 , 一朝完整亮相:
史无前例、最全面的百度语言与知识技术成果分享;
重磅推出5款语言与知识产品新发布;
还有全球最大的产学研共建中文语言与知识数据集计划公布 。
并且 , 走在语言与知识领域开源之先的百度 , 还在七夕这一天 , 为NLP从业者们奉上了一份「十周年大礼」:
发布百度语言与知识算力共享计划 。
百度百度一口气亮出NLP十年积累:完整技术布局全面披露
本文插图
王海峰详解百度语言与知识完整布局
今天 , 百度大脑语言与知识技术峰会在线举行 。
王海峰全面分享了百度语言与知识技术完整布局和最新成果 。
作为国内最早代表工业界亮相NLP顶会的企业 , 百度十年以来的技术成果不可谓不丰硕:
包括国家科技进步奖在内的20多个奖项 , 30多项国际竞赛冠军 , 发表学术论文超过300篇 , 申请专利2000多项 。
百度百度一口气亮出NLP十年积累:完整技术布局全面披露
本文插图
并且 , 这些技术创新也在源源不断地落地到实际产品当中 , 语义理解技术与平台文心(ERNIE)、智能对话定制和服务平台UNIT、自动文稿转视频的智能创作平台……
所以 , 百度是如何把握语言与知识这艘航船的方向 , 使其在产业前沿「乘风破浪」的?
王海峰说:
在百度语言与知识技术的布局和发展中 , 我们始终在注意把握两个趋势 , 即技术发展趋势和产业发展趋势 , 并力争引领趋势 。
王海峰谈到 , 语言与知识技术是人工智能认知能力的核心 , 以语言和知识为研究对象 , 让机器像人一样掌握知识、理解语言的自然语言处理技术 , 对于人工智能发展至关重要 。
正是基于这样的前瞻性判断 , 在人工智能尚未成为显学的2010年 , 百度就正式成立了NLP部门 , 展示了攻坚前沿技术的决心 。
百度百度一口气亮出NLP十年积累:完整技术布局全面披露
本文插图
王海峰表示 , 历经近十年发展 , 百度已经构建了完整的语言与知识技术布局 , 包括知识图谱、语言理解与生成技术 , 以及上述技术所支持的包含智能搜索、机器翻译、对话系统、智能写作、深度问答等在内的的应用系统 。
百度百度一口气亮出NLP十年积累:完整技术布局全面披露
本文插图
以知识图谱为基础
具体而言 , 知识图谱是机器认知世界的基础 。
王海峰指出 , 机器认知能力的突破 , 越来越依赖对知识和大规模知识图谱的运用 。
在这方面 , 百度打造了世界上最大的多元异构知识图谱 , 拥有超过50亿实体和5500亿事实 , 并在不断演进和更新 , 应用于各行各业 。 现在 , 其每日调用次数超过400亿次 。
百度百度一口气亮出NLP十年积累:完整技术布局全面披露
本文插图
不仅如此 , 针对不同应用场景和知识形态 , 百度还建立起多样化的知识图谱类型 , 既有基础的实体知识图谱 , 也有行业知识图谱、事件图谱、关注点图谱等 , 以及融合语音、视频、图片的多模态知识图谱 。


推荐阅读