百度百度一口气亮出NLP十年积累:完整技术布局全面披露( 四 )
同时 , 吴甜还表示 , 这套方案中使用的AI同传技术 , 会同步面向所有开发者开放 。
智能创作平台全新升级
大洋彼岸 , 微软已经将MSN和Edge浏览器中的新闻推送交给AI来做 。
实际上 , 2019年初 , 百度早已上线智能创作平台 。 平台不断丰富辅助创作和自动创作能力 , 包括图文转视频这样的「爆款」功能 。
这一次 , 百度智能创作平台面向媒体行业 , 推出智能策划、智能采编和智能审校3大场景方案 。
从选题 , 到文字、视频生产的采编环节 , 再到文本、格式校对 , 全面帮助媒体机构与个人提升创作效率 。
本文插图
UNIT智能对话定制与服务平台升级
在智能对话方面 , 百度此次也升级了UNIT智能对话定制与服务平台 , 进一步降低任务式对话、智能问答的定制成本 , 并融合了通用对话能力 , 以提升交互体验 。
智能客服、小度车载OS、小度DuerOS都是其能力的输出场景 。
为了让开发者更加高效地获得高质量的对话理解能力 , UNIT本次重点升级了3项技术 , 并将数据标注成本进一步降低30%以上 。
首先 , 是小样本意图理解能力升级 。 每个意图提供10个标注样本 , 就能达成准确率88%的意图识别 , 显著降低数据标注成本 。
本文插图
基于开发者给定的自定义词槽值 , UNIT能自动为开发者推荐口语化同义词;基于依存句法分析技术与通用关键词识别技术 , 还能自动发现修饰关系 , 降低开发者的分析难度 。
其次 , 是表格问答能力升级 。
开发者只需要上传业务数据表格 , 后续的所有分析、整理过程均可由UNIT自动完成 。
吴甜表示 , 1分钟自动分析后 , 产出的问答机器人已经可以准确回答大部分基于表格的事实型问题;再进行1小时左右的人工调优后 , 问答机器人达到的水平 , 相当于以往通过至少2周人工整理FAQ建设的问答系统的水平 。
本文插图
最后 , 是新一代融合对话引擎 。 融合业界首个基于隐空间的端到端预训练对话生成模型PLATO , 提升对话内容丰富度和流畅度 , 提升交互体验 。
以上 , 就是百度语言与知识技术峰会上发布的新产品与新升级 。
由此可见 , 在语言理解、语言生成、对话、机器翻译这4个NLP领域的重要方向 , 百度依托自身在语言与知识技术领域的多年深耕 , 将核心技术以技术平台和产品的形式提供给开发者、业务应用者 , 布局全面 , 几乎没有什么短板 。
如此丰富、全面、开放的产品 , 无疑有助于推动语言与知识技术的落地应用 , 以及整个语言与知识领域的技术发展 。
而能交出这样一份全能答卷 , 亦是在深度学习尚未成为显学之际 , 以王海峰为首的百度科学家智者见于未萌之功 。
产学研共建中文信息处理数据集 , 还有算力共享计划
不只是要用核心技术服务于产业发展 , 在开源方面 , 百度语言与知识也一直走在产业前沿 。
在峰会上 , 百度联合中国计算机学会、中国中文信息学会共同发布「千言」数据共建计划 。
本文插图
百度技术委员会主席吴华表示 , 语言与知识技术在大规模产业化应用中面临三个挑战:模型处理多个子任务的能力、泛化能力 , 以及模型鲁棒性带来的应用安全和用户体验问题 。
「千言」作为全球最大的面向NLP的中文开源数据共建项目 , 正是为了应对这些挑战、促进中文NLP发展而生 。
推荐阅读
- 百度联盟陈一凡:小程序之间的竞争主要体现在场景上
- 价值资讯观察|股价大跌!百度将在美遭遇集体诉讼
- 腾讯微博|既然网盘生意那么烧钱,为什么阿里迅雷还要和百度网盘抢饭碗?
- 甜腻的嘴角|领空安全不容侵犯!俄战机向美军亮出导弹,几天后尴尬一幕发生
- 天美|王者官方彻底爆发,一口气连封100个违规账号,看到态导ID,沸腾
- 强国网|是对西方发出强烈信号,美国人:俄罗斯亮出这一款新型导弹
- 晓丽八卦|曼多拉才是《叶罗丽》大姐大,一口气威胁3个大仙子,庞尊也认怂
- 国安|燃爆!卓尔外援7秒疯狂庆祝:振臂怒吼+空翻,亮出肌肉挑衅国安
- 萧涛涛|萧涛涛迎来新队友!昆山FC一口气官宣仨外援,提前眀牌要冲超?
- 精兵堂1|稀土根本不是核心,这次只有我们掌握技术,中国亮出终极“大招”
