行业互联网|百度语音交互持续迭代打造端到端信号声学一体化建模等前沿技术( 二 ) AI人工智能|行业

文章图片

而在语音合成方面，百度自2013年启动语音合成研发，历经参数合成、拼接合成、深度学习语音合成和端到端的语音合成，到如今全新升级为包含个性化、多风格多角色、单人千面的语音合成系统，百度语音合成技术始终处于升级迭代中。
会上，贾磊依次介绍了百度语音合成技术的最新成果——个性化TTS ，多风格、多角色，单人千面。个性化TTS是个性化定制的Meitron语音合成系统的最新演进，是基于子带分解和GAN_loss的端侧神经网络声码器，也是业内首个在手机端多人通用的端侧的基于神经计算的声码器。个性化TTS相较于传统的基于信号处理和参数的声码器， ABX提升可以达到65：35 ，其已应用于地图导航，目前每日的导航播报超过1亿次。
多风格、多角色的语音合成，则是针对娱乐内容产业(例如小说)中存在的多个角色交替、多种情感需求并存的播报需求而研发的新技术。此前，用单一音色播报缺乏表现力，播报语音和文字本身的角色情感不一致，用户长时间听感到单调疲倦。百度通过深度学习技术对小说文本进行分析，判断出角色、身份、情感，再借助多风格、多角色语音合成技术去合成小说中的声音，从而实现声音自然流畅、情感表现力丰富、用户体验优美的效果。

文章图片

文章图片

针对一个发音人需要用不同风格播报文本的应用场景，百度推出单人千面语音合成技术。该技术能够把说话人的语音、文本、风格、内容、音色都进行分离，在进行语音合成的时候自由组合，从而能够让一个发音人同时去播报新闻、小说、脱口秀、读书、诗歌等不同风格。
【行业互联网|百度语音交互持续迭代打造端到端信号声学一体化建模等前沿技术】“百度智能语音交互的产业化成果丰硕，目前百度智能语音的日均调用量超过155亿次，广泛应用于移动端、智能家居、智能车载、智能服务以及语音IoT ，极大地提高了中国社会的智能化程度。”贾磊表示。语音技术作为百度大脑的重要AI能力之一，不但应用于百度搜索、百度输入法、百度地图、小度音箱等百度系列产品，更通过百度大脑AI开放平台广泛赋能众多行业和场景的合作伙伴。未来，百度还将持续创新升级语音交互技术，推进语音技术应用落地，助力更多产业智能化转型升级。

行业互联网|百度语音交互持续迭代打造端到端信号声学一体化建模等前沿技术( 二 )

推荐阅读

高考真的公平吗？

超好看的言情小说推荐不如1种“药水”，浇1次，不烂根不黄叶，用淘米水、啤酒水养花

记得有一种玉米外形的小蛋糕里面还有夹心，哪里有卖的啊！！！?

#姚明#2011年姚明受伤成为自由球员，其他球队给他的报价是怎样的

同比增长|金岭矿业：预计2020年前三季度净利润2亿元~2.15亿元，同比增长14.86%~23.47%

一加Nord|一加Nord海外正式发布恐无缘大陆市场

蛤蜊|姜末蛤蜊、水晶蛏肉、三丝拌蛏……鲜嫩清醇，爽口不腻

关于健身的一些误区

药监局发文！孩子慎用这两类鼻炎常用药

「天云解说」小乔丁香结屹然在列，这款手感极佳！，最受欢迎的6元系列皮肤

产业气象站 Strike一个历史遗留漏洞的研究，对红队利器Cobalt

「大学生」全国19省开学时间确定，6省4月7号开学，4省3月30号开学

吃货|卖30多一个的狗不理包子，吃的名号还是口味？自己在家做不香吗

中亚天然气管道向中国输气增长超23% 合作迈新台阶

美依lady|原来须刘海就是“妲己发型”！这么成熟有味的发型，整一个玩玩

中国|时政微视频丨瞰安徽

甘宁|三国杀：四方势力开启神将争锋，吴国势力加入神甘宁后更强了

茅盾@他高考写错自己名字，北大研究后特批：允许改卷子，破格录取

「火爆新闻」哪一部最有爆款潜质？，待上映的8部爆款剧！肖战王一博神仙打架

【猫咪】多猫家庭太幸福！为了猫咪们相处融洽，猫奴这4点要记牢

行业互联网|百度语音交互持续迭代 打造端到端信号声学一体化建模等前沿技术( 二 )

推荐阅读

行业互联网|百度语音交互持续迭代打造端到端信号声学一体化建模等前沿技术( 二 )