行业互联网|百度语音交互持续迭代打造端到端信号声学一体化建模等前沿技术 AI人工智能|行业

9月15日， AI领域的行业盛会“百度世界2020”大会于线上隆重召开，一大波硬核技术袭来：百度创始人、董事长兼CEO李彦宏与总台央视主持人康辉“虚拟人”亮相、颠覆搜索形态的“度晓晓”、没有驾驶员的“全自动驾驶”、各行各业赋能案例……既有硬核技术，又有“接地气”的落地应用。

文章图片

文章图片

(百度世界2020央视新闻直播间)
在当天的百度大脑分论坛上，百度语音首席架构师贾磊重点讲解了百度端到端语音交互技术。他表示，百度语音交互技术持续迭代升级，已发展成为基于深度学习技术的端到端的语音识别和语音合成技术。在语音识别层面，百度推出端到端信号声学一体化建模的技术，语音合成方面，最新的Meitron和单人千面合成个性化技术亮相。同时交出了百度语音技术最新成绩单：日均调用量超过155亿次，广泛应用在移动端、智能家居、和语音IoT等场景，智能语音产业化成果丰硕。

文章图片

文章图片

(百度语音首席架构师贾磊)
会上，贾磊分别从语音识别和语音合成两个技术维度详解了百度语音技术的发展迭代和最新成果。在语音识别方面，百度语音识别技术持续创新，从2012年首推深度学习技术，到2019年在业内首先把注意力模型应用于在线语音识别，推出流式多级的截断注意力模型 SMLTA;再到如今全面进化为端到端的信号声学一体化建模技术，在助力百度自身业务发展的同时，更好地赋能多场景、多产业应用。

文章图片

文章图片

作为百度语音识别技术的最新成果，端到端的信号声学一体化建模技术很好地解决了传统数字信号处理和语音识别级联系统的各种问题，抛弃了各自学科的学科假设，通过端到端的建模，大幅提升了远场语音识别率。

文章图片

文章图片

据贾磊介绍，端到端的信号声学一体化建模技术由模型波束技术和模型AEC技术组成。前者进化为多分区融合的模型波束建模技术，在国际上由百度首次提出，较单分区技术进一步提升识别性能15%以上;后者是升级为基于双LOSS实值掩蔽的模型AEC技术，可以解决设备有非线性情况下的回波消除问题，使得设备即使在播放音乐的时候，也能够进行成功的打断和高精准的语音识别。

文章图片

文章图片

此外，贾磊还在会上介绍了百度今年推出的端侧全双工语音交互技术。据他介绍，百度端侧全双工语音交互技术将复杂的建模过程转化为3个端到端的深度学习过程，即信号声学一体化建模、声学语言一体化建模以及语义置信一体化建模。通过端到端的建模，该技术能够将整个复杂的端侧交互转变成若干个深度学习计算，使得依靠一颗AI芯片就能完成端侧的全双工语音交互，从而大幅度提升车载手机等语音交互性能，显著改善用户体验。

文章图片

行业互联网|百度语音交互持续迭代打造端到端信号声学一体化建模等前沿技术

推荐阅读

「火爆新闻」哪一部最有爆款潜质？，待上映的8部爆款剧！肖战王一博神仙打架

超好看的言情小说推荐不如1种“药水”，浇1次，不烂根不黄叶，用淘米水、啤酒水养花

记得有一种玉米外形的小蛋糕里面还有夹心，哪里有卖的啊！！！?

高考真的公平吗？

茅盾@他高考写错自己名字，北大研究后特批：允许改卷子，破格录取

蛤蜊|姜末蛤蜊、水晶蛏肉、三丝拌蛏……鲜嫩清醇，爽口不腻

「天云解说」小乔丁香结屹然在列，这款手感极佳！，最受欢迎的6元系列皮肤

「大学生」全国19省开学时间确定，6省4月7号开学，4省3月30号开学

一加Nord|一加Nord海外正式发布恐无缘大陆市场

产业气象站 Strike一个历史遗留漏洞的研究，对红队利器Cobalt

吃货|卖30多一个的狗不理包子，吃的名号还是口味？自己在家做不香吗

同比增长|金岭矿业：预计2020年前三季度净利润2亿元~2.15亿元，同比增长14.86%~23.47%

中亚天然气管道向中国输气增长超23% 合作迈新台阶

【猫咪】多猫家庭太幸福！为了猫咪们相处融洽，猫奴这4点要记牢

美依lady|原来须刘海就是“妲己发型”！这么成熟有味的发型，整一个玩玩

#姚明#2011年姚明受伤成为自由球员，其他球队给他的报价是怎样的

关于健身的一些误区

药监局发文！孩子慎用这两类鼻炎常用药

中国|时政微视频丨瞰安徽

甘宁|三国杀：四方势力开启神将争锋，吴国势力加入神甘宁后更强了

行业互联网|百度语音交互持续迭代 打造端到端信号声学一体化建模等前沿技术

推荐阅读

行业互联网|百度语音交互持续迭代打造端到端信号声学一体化建模等前沿技术