中国经营网|淘宝曝光虚拟主播 声音样本采自马云高晓松


本报采访人员 李立 上海报道
淘宝直播在最近一次内部分享会上曝光了虚拟主播 , 这个由阿里达摩院直接支持的项目从今年年初秘密启动 。
从曝光样本看 , 虚拟主播Bonne可以在主播休息时独立上岗 , 可以进行商品播报 , 为用户提供24小时智能货品推荐和1对1的在线服务 。
“不管碰到什么问题 , 智能主播都可以在直播中给到消费者解答 , 帮助主播和粉丝更好互动” , 淘宝直播产品负责人岱妍告诉《中国经营报(博客,微博)》采访人员 , 研制虚拟主播有两层目的 , 一是帮主播在休息时值班 , 做粉丝运营;其次是在直播过程中 , 帮主播去完成一些没有办法及时完成的随时应答和粉丝互动 , 起辅助作用 。
马云、矮大紧变声主播?
虚拟主播将不再是冷冰冰的机器 , 会和主播的个性化做强匹配 , 有独立的人设、独特的说话方式和声线 , 包括丰富的表情 。 短发、活泼 , 说话时大眼睛忽闪忽闪的虚拟主播Bonne , 原型就是岱妍本人 。
岱妍向采访人员透露 , 当时“抠”这个形象初衷就是想让产品经理自己上阵 , 亲自体会怎么做主播怎么为粉丝提供更好的服务 。
虚拟主播的开发是人工智能场景中非常复杂的应用之一 , 淘宝内部相关负责人告诉采访人员 , 淘宝直播背后站的是达摩院和顶级科学家 , 这个今年才开始的项目最根本的目的是帮助商家提效 , 阿里会在这个技术层面上持续投入 , 这也会是淘宝直播和其他直播平台的重要区别之一 。
“主要的技术挑战来自三个层面” , 阿里巴巴达摩院资深算法专家陈海青介绍 , 第一个是人物表现力 , 怎么去结合多模态的信息去做人物表现力 , 比如嘴型、表情和肢体的驱动 , 同时涉及到大量的数据、以及大量的群体模型的数据搜集 。
“其次是声音表现力 , 基于场景化的声音怎么能做到更好的表现力 。 剧本和商品挑战也很大 , 即便今天有大量的商品和详情页的数据 , 但是遇到’双11’这样的重要节点 , 我们的技术还只具备小样本数据下的工作和能力” , 陈海青说 。
“在主播的人物驱动上 , 个性化TTS(人类语音用人工合成的方式产生)是很重要的一环” , 据陈海青透露 , 很重要的一个重点在于目标说话人少且质量差 , 带有噪音混响 , 快速还原难度就很大 。 不过现在已经可以做到手机录音20句 , 90%的还原度 , 在半小时内完成构建 。
采访人员发现声音采集样本中 , 收录了马云、逍遥子 , 高晓松(花名矮大紧)、周冬雨等人的声音样本 , 根本录音样本可以让马云、高晓松的声音出现在更多的场景里 , 比如让马云直播带货介绍商品 , 高晓松直接开口飚英文都可以实现 。
在人物驱动上 , 虚拟主播还在追求更细节的处理 。 经过数据对比发现 , 不同的语气、口头禅都会对直播带货产生不同影响 , 比如主播一开口套用了李佳琦的句式 , “OMG , 今年的大促活动也太划算了吧” , 对商品的形容更具体生动“emm,壳很酥脆 , 夹心也是入口即化哦” , 带货的效率和转化率都会明显提升 。
中国经营网|淘宝曝光虚拟主播 声音样本采自马云高晓松
本文插图

躺赚粉丝?
虚拟主播的带货效果究竟如何 , 红人主播林珊珊团队负责人凌霄分享了试用心得 。
“刚开始收到虚拟主播这个产品 , 从心里是拒绝的 , 觉得这个东西可能没有真人那么种草 , 甚至他会不会拔草” , 但试用下来数据还不错 。
凌霄告诉采访人员 , “第一次试用 , 共有14.6万观看 , 最高在线1400人 , 增粉240人” , 粗略计算 , 以一个粉丝一年在店铺成交1万元 , 就等于增加240万GMV , “并且这些都是半夜里主播在睡觉时发生的” 。
淘宝方面暂时没有公布虚拟主播的转化率、和具体的上线时间 , “但是在粉丝增量、时长和对GMV的拉动很有想象力” , 据岱妍介绍 , 目前虚拟主播的上线场次已经超过了1000场 。


推荐阅读