行业互联网|百度语音交互持续迭代 打造端到端信号声学一体化建模等前沿技术( 二 )
文章图片
而在语音合成方面 , 百度自2013年启动语音合成研发 , 历经参数合成、拼接合成、深度学习语音合成和端到端的语音合成 , 到如今全新升级为包含个性化、多风格多角色、单人千面的语音合成系统 , 百度语音合成技术始终处于升级迭代中 。
会上 , 贾磊依次介绍了百度语音合成技术的最新成果——个性化TTS , 多风格、多角色 , 单人千面 。个性化TTS是个性化定制的Meitron语音合成系统的最新演进 , 是基于子带分解和GAN_loss的端侧神经网络声码器 , 也是业内首个在手机端多人通用的端侧的基于神经计算的声码器 。个性化TTS相较于传统的基于信号处理和参数的声码器 , ABX提升可以达到65:35 , 其已应用于地图导航 , 目前每日的导航播报超过1亿次 。
多风格、多角色的语音合成 , 则是针对娱乐内容产业(例如小说)中存在的多个角色交替、多种情感需求并存的播报需求而研发的新技术 。此前 , 用单一音色播报缺乏表现力 , 播报语音和文字本身的角色情感不一致 , 用户长时间听感到单调疲倦 。百度通过深度学习技术对小说文本进行分析 , 判断出角色、身份、情感 , 再借助多风格、多角色语音合成技术去合成小说中的声音 , 从而实现声音自然流畅、情感表现力丰富、用户体验优美的效果 。
文章图片
文章图片
针对一个发音人需要用不同风格播报文本的应用场景 , 百度推出单人千面语音合成技术 。该技术能够把说话人的语音、文本、风格、内容、音色都进行分离 , 在进行语音合成的时候自由组合 , 从而能够让一个发音人同时去播报新闻、小说、脱口秀、读书、诗歌等不同风格 。
【行业互联网|百度语音交互持续迭代 打造端到端信号声学一体化建模等前沿技术】“百度智能语音交互的产业化成果丰硕 , 目前百度智能语音的日均调用量超过155亿次 , 广泛应用于移动端、智能家居、智能车载、智能服务以及语音IoT , 极大地提高了中国社会的智能化程度 。”贾磊表示 。语音技术作为百度大脑的重要AI能力之一 , 不但应用于百度搜索、百度输入法、百度地图、小度音箱等百度系列产品 , 更通过百度大脑AI开放平台广泛赋能众多行业和场景的合作伙伴 。未来 , 百度还将持续创新升级语音交互技术 , 推进语音技术应用落地 , 助力更多产业智能化转型升级 。
推荐阅读
- 羽度非凡|电视行业的误导:4K搭配高亮度就是不伤眼的真高清?
- 行业互联网|华为在法国成立第六家研究所,将会继续提升研发能力
- 行业互联网|大华股份与浙江高信签署战略合作协议 共建智慧交通
- 行业互联网|常程跳槽判决来了,支付525亿“违约金”!结果依然有望反转?
- 行业互联网|华为为何在法国就设立了6家研发中心?
- 行业互联网|2020走进华为西安研究所成功举办,探索“5G+云+AI”
- 行业互联网|华为 | 车载以太网物理层及TSN发展现状 与技术趋势
- 互联网乱侃秀|家里洗衣机噪音太大?这些原因你都排查了吗
- 行业互联网|移远通信携手中国移动举办5G行业终端扬帆计划闭门会
- 行业互联网|【富士康出售63万股阿里巴巴ADS,再获利1.2亿美元】
