秀秀科技 微软联合浙大提出FastSpeech2,FastSpeech语音合成系统技术升级( 三 )


秀秀科技 微软联合浙大提出FastSpeech2,FastSpeech语音合成系统技术升级
文章图片
表3:从Teacher模型和MFA得到的Duration对比
秀秀科技 微软联合浙大提出FastSpeech2,FastSpeech语音合成系统技术升级
文章图片
表4:消融实验
秀秀科技 微软联合浙大提出FastSpeech2,FastSpeech语音合成系统技术升级
文章图片
未来工作
未来 , 我们将在FastSpeech2中尝试引入更多的可变信息来提高并行语音合成的音质 , 并且尝试更加轻量的模型 , 从而进一步提升生成语音的速度 。
我们一直致力于语音方面的研究 , 包括文本到语音合成、低资源语音合成与识别、语音翻译、歌声及音乐合成等 。 欢迎关注我们语音方面的研究工作:https://speechresearch.github.io/
论文链接:
[1]FastSpeech:Fast,RobustandControllableTexttoSpeech
paper:https://arxiv.org/pdf/1905.09263.pdf
demo:https://speechresearch.github.io/fastspeech/
article(Chinese):https://mp.weixin.qq.com/s/aHupAjPNFdUdaG9Uof_obQ
article(English):https://www.microsoft.com/en-us/research/blog/fastspeech-new-text-to-speech-model-improves-on-speed-accuracy-and-controllability/
[2]FastSpeech2:FastandHigh-QualityEnd-to-EndTexttoSpeech
paper:https://arxiv.org/pdf/2006.04558.pdf
demo:https://speechresearch.github.io/fastspeech2/
本文作者:任意、胡晨旭、谭旭、秦涛、赵晟、赵洲、刘铁岩
秀秀科技 微软联合浙大提出FastSpeech2,FastSpeech语音合成系统技术升级
文章图片


推荐阅读