百度百度一口气亮出NLP十年积累:完整技术布局全面披露( 五 )


百度百度一口气亮出NLP十年积累:完整技术布局全面披露
本文插图
千言第一期 , 包括百度在内 , 有来自11家研究机构、企业的数据集作者进行了共建 , 包括清华、哈工大、中科院、腾讯、华为、微软等等 。
第一期总共涵盖7大任务、20多个中文开源数据集合 。
任务类型包括开放域对话、阅读理解、机器同传、情感分析、语义解析、信息抽取和文本相似度 。 同时 , 每个任务都提供了多维度的综合评价 , 关注评价模型的全面性、鲁棒性和泛化性等 。
这一项目计划在未来3年 , 面向20多个任务 , 收集和建设不少于100个中文自然语言处理数据集 , 以覆盖知识图谱、语言理解、语言生成、NLP应用系统、跨模态融合技术等领域 。
吴华表示:
未来 , 我们希望有更多的数据集作者能够参与共建千言 , 共同推动中文信息处理技术的进步 , 建设世界范围的中文信息处理影响力 。
同时 , 为了应对算力需求的挑战 , 百度也正式发布了「百度语言与知识算力助力计划」 , 对外开放共享百度算力:
通过AI STUDIO平台 , 为语言与知识技术开发者 , 提供算力支持 。
一手推动开源共建 , 一手发放海量福利 , 作为十年来语言与知识工业界的领头羊 , 百度的雄心 , 不言而喻 。
百度NLP「十年十人」
最后 , 在峰会上 , 百度还首次向业内介绍百度语言与知识领域十年里的「代表人物」——百度NLP「十年十人」 。
百度百度一口气亮出NLP十年积累:完整技术布局全面披露
本文插图
王海峰 , 百度首席技术官 , ACL主席(2013) , AACL创始主席 , ACL Fellow , 中国中文信息学会副理事长 。
Kenneth Church , Baidu Research Fellow , ACL 主席(2012) , ACL Fellow , EMNLP 创始人 。
吕雅娟 , 百度高级科学家知识图谱技术负责人、中国计算机学会中文信息技术专委会副主任(2015-2019) 。
吴华 , 百度技术委员会主席 , ACL Program Chair(2014) 。
【百度百度一口气亮出NLP十年积累:完整技术布局全面披露】黄亮 , 百度杰出架构师、IDL(美国)主任 , ACL Area Chair (2012, 2014, 2018, 2019) 。
吴甜 , 百度集团副总裁 。
赵世奇 , 百度 MEG 用户产品策略平台负责人 , ACL 秘书长(2016-2020) 。
田浩 , 百度研究院首席架构师 。
何中军 , 百度人工智能技术委员会主席 。
于佃海 , 百度飞桨平台总架构师 。
均是NLP领域里响亮的名字 。
其实 , 正是像这样的科学家、从业者的星聚 , 汇作一团火 , 让中国NLP在2010到2020的这个十年中 , 完成「破圈」 , 披荆斩棘地走到世界NLP舞台中央 。
而以百度为代表的工业界NLP研发力量 , 作为NLP十年发展的全程见证者、参与者 , 也正在用脚踏实地的技术积累、高瞻远瞩的全面布局和开源开放的态度 , 推动着NLP技术的进步 , 建设着世界范围的中文信息处理影响力 。
这不只是百度NLP的十年 , 也是中国NLP的十年 。
下一个十年 , 自然语言处理 , 将是中文论剑的时代 。
你说呢?
— 完 —


推荐阅读