2020百度世界大会怎么回事?2020百度世界大会背后的真相( 七 )


自然交互智能音箱
2020百度世界大会怎么回事?2020百度世界大会背后的真相
文章图片

高亮介绍到 , 远场语音交互的基础问题是要唤得醒 , 听得清 , 但还有更多体验的问题需要解决:每次交互都要唤醒 , 话没说完总被截断 , 不知道说话人是谁 , 没有上下文 , 外部噪音识别太差 。
百度创新了语音语义技术以实现一次唤醒连续交互 , 也能解决以上交互体验的问题 。 这个技术也是谷歌和微软发布的全双工语音交互”技术 。
高亮在现场演示了新款音箱 。 在大会会场这样高噪音的环境下 , 说话的距离超过1米 , 音箱的唤醒和识别表现很好 。 一次唤醒就能多次对话 , 智能音箱在说话时 , 也能聆听用户的新命令并且快速执行 。 从更多的演示deme来看 , 其也能实现一定的上下文理解 。
2020百度世界大会怎么回事?2020百度世界大会背后的真相
文章图片

据高亮介绍 , 一次唤醒多轮对话的能力依赖于多项声纹、语音、语义技术的进步 , 包括创新的尾点检测技术 , 其利用云端信号AD技术一边做语音识别一边发给语义VAD , 将声学技术与语义技术结合在一起 , 能够适应用户说话速度 , 知道用户什么时候说完了 , 不在中间打断 。
2020百度世界大会怎么回事?2020百度世界大会背后的真相
文章图片

鲁棒拒识技术创新了声纹跟踪、语音置信度、声学置信度 , 可以基于特定说话人的场景化识别 , 拒绝非音箱交互人声 , 拒绝聊天内容与场景不一致的对话 。
机器人躲避人流
计算机视觉是人工智能最热的赛道 , 诞生出多个AI独角兽公司 , 2018年CV赛道趋于平静 , 新的风口转向三维视觉 。 百度也展示了自己在三维视觉方向的进展 。
百度三维视觉首席科学家杨睿刚介绍了百度视觉语义化平台技术架构 , 包括底层的芯片、传感器、硬件到图片分析、视频分析等技术和应用 。
百度大脑的三维视觉主要应用于图片分析、视频分析、AR和机器人四个方面 。
图片分析里引入人脸信息 , 活体识别正确率高达99.55% , 此能力已经集成到手机上;视频分析的三维人体跟踪 , 人体检测和跟踪准确率超过95% , 主要应用于零售行业 , 百度推出全新AI零售体验店——Hisense;百度推出DuMix AR3.0视频特效解决方案 , 在多达20款应用进行整合;机器人导航方面 , 通过创建仿真学习环境 , 通过百万次的训练可以得到在复杂环境中也能运行的导航算法 。
语言与知识技术平台
在自然语言处理方面 , 百度创新了面向行业的语言与知识技术平台 。 百度大脑发布语言与知识技术平台” , 打造针对行业的解决方案 , 从客服和媒体内容创作深度切入 。 该平台可以输出全流程客服智能化解决方案 , 相对人工客服 , 人工通话接单量降低70% , 人工客服通话人均时长降低50%;相对传统按键智能客服 , 人工通话接单量降低20% , 人工客服通话人均时长降低15% , 从而提升行业效率 , 降低业务成本 。 在媒体内容创作方面 , 仓颉语言生成平台可为用户定制专属AI创作助手” , 其内置的丰富素材、模板和知识图谱可通过多模理解和语音生成输出特定内容 , 一站式多场景语言生成能力 , 且具备灵活地应用方式 , 可以大大提升媒体从业者的工作效率 。
百度灵医”
AI+医疗”是备受关注的领域 。 此次百度也发布AI医疗品牌百度灵医” , 旨在以循证医学为基础 , 整合多项AI技术 , 以赋能医院及行业伙伴为目的 , 以帮助提升基层医疗水平为主要目标 , 辅助医生提升诊疗效率 , 从而惠及更多患者 。 不仅如此 , 百度还打造眼底AI筛查一体机 , 使基层医疗机构具备眼底筛查能力 , 帮助人们更早发现和预防眼科疾病 。 百度AI眼底筛查系统可以帮助患者快速筛查包括糖网、青光眼、黄斑病等多种眼疾病 , 目前已在多个地区落地 , 累计服务


推荐阅读