探索AI数字人在业务场景的落地,数字内容及互动解决方案的形成( 二 )

  相芯科技公司基于与阿里云的合作在很多领域开始进行AI数字人技术的应用落地 。 相芯科技的AI数字人技术 , 只需要输入一段文字 , 就可以全自动地合成整个人的说话 , 包含动作、形态、情绪的视频 。 公司搭建的虚拟主播云平台如下图所示 。 在平台编辑界面中 , 用户可以对虚拟人物的角色、对话内容脚本及相关人物动作进行选择 , 并通过阿里云的云服务器进行渲染和视频合成 , 就能快速生成数字人的视频 , 用户可以自行将视频下载 , 并进行分发 。


探索AI数字人在业务场景的落地,数字内容及互动解决方案的形成

----探索AI数字人在业务场景的落地 , 数字内容及互动解决方案的形成//----

  虚拟主播及虚拟机器人

  下图所示为公司虚拟主持人模块的架构 。 公司将相关脚本输入 , 通过TTS语音技术完成人物语音的合成 , 在STA(Speech-to-Animation)模块中进行动画及视频合成 , 最后生成相关的虚拟视频 。 企业同时对互动助手、虚拟机器人技术架构进行了开发 。 在数据输入部分 , 系统通过接入自然语言处理等模块完成了机器人问答系统的搭建 , 以此支持数字人与用户的实时交互功能 。


探索AI数字人在业务场景的落地,数字内容及互动解决方案的形成

----探索AI数字人在业务场景的落地 , 数字内容及互动解决方案的形成//----

  语音技术合作伙伴—阿里云TTS

  STA业务打造的虚拟主播与虚拟客服 , 都离不开语音合成技术TTS的支持 。 企业对市面上提供TTS服务的公司进行调研对比后 , 选择了阿里云TTS作为合作伙伴 。 企业通过与阿里云TTS的合作 , 为数字人角色搭建了真实自然的语音模型 , 并陆续在进行更深层次的技术合作 。


探索AI数字人在业务场景的落地,数字内容及互动解决方案的形成

----探索AI数字人在业务场景的落地 , 数字内容及互动解决方案的形成//----

  STA算法流程

  下图所示为STA(Speech-to-Animation)算法流程示意图 。 企业将文本数据与语音数据共同作为算法数据导入算法模块中 , 算法将会对语音数据中的情绪及语速等因素进行分析 , 以此合成出数字人说话的口型、发音及与用户的对话情景等数据 , 通过分析出的数据驱动数字人表现出自然生动的画面 。


探索AI数字人在业务场景的落地,数字内容及互动解决方案的形成

----探索AI数字人在业务场景的落地 , 数字内容及互动解决方案的形成//----

  图形合成模块

探索AI数字人在业务场景的落地,数字内容及互动解决方案的形成。  企业经过一系列探索 , 目前已拥有了完备的数字人表现及部署方案 。 从3D卡通形象到高精度虚拟人形象企业均可提供良好的塑造技术支持 。 企业可以使用不同的虚拟人物完成不同业务场景下对虚拟人物的需求 , 包括且不限于支持智能手机、终端及大屏上数字人的问答业务、支持云渲染实现高质量视频合成等业务场景 。


推荐阅读