语音助手|探路人与解题者:腾讯数字生态大会上AI语音助手+X的无限可能( 二 )


针对这些AI语音助手在产业端、市场端的落地尴尬 , 存不存在可能的解决之道呢?从“工具人”转变为“数字人” , 让用户从“声控”转变为“颜控” , 就是腾讯数字生态大会上给出的一个十分吸睛的解题思路 。
让用户跟AI多聊两句 , 数字助理需要具备哪些超能力?
“如果那笙哪里做的不对 , 主人不要嫌弃我我有在努力呢”——试问听到这种对话 , 你还会吐槽语音助手偶尔出现的小失误 , 甚至还有点想反思自己是不是过于吹毛求疵了呢?
沿着这个思路 , 我们可以看到形象化之后 , 腾讯云小微在数字助手领域都打造出了哪些超能力:
1.语音+视觉交互 , 借助腾讯系海量IP打造出各种形象、生动、贴近现实需求的形象 , 提升交互频率 , 从而真正有效地减轻人类工作负担 。比如疫情期间 , 就有老师表示希望有分身到每个学生身边指导他们 , 而数字助理的拟人化交互恰好可以完成这一任务;
2.丰富的知识体系 , 利用知识图谱与深度学习技术 , 数字助手可以快速调用海量信息 , 完成问答、资讯等服务 , 再通过拟人化的形象输出给用户 , 人们会在服务过程中对技术产生一定的包容和理解 。为故宫打造的清朝内阁大学士“福大人” , 就担任起了知识渊博的游览助手;
语音助手|探路人与解题者:腾讯数字生态大会上AI语音助手+X的无限可能
文章图片

文章图片

3.个性化情感关系:智能语音助手等新鲜事物的核心受众群以年轻人为主 , 而随着国漫崛起 , 年轻人对标新立异的虚拟形象更感兴趣 。而对于渴求增长与变化的企业来说 , 与其按部就班地在声音世界里打转 ,尤其是在线上化业务增多 , 用户的交互频率和方式增长的情况下 , 年轻市场也需要新的服务形态来被重新激活;
此外 , 伴随着产业数字化程度的推进 , 企业想要在数据洪潮中传达出具象的品牌形象 , 新的视觉载体是不可或缺的 。消费者的行为和决策链路也在数字世界中变得更加隐蔽、复杂 , 如何保持黏性 , 建立用户与品牌的情感连接也成为应有之义……
上述种种 , 或许都可以通过一个人格化、陪伴式的“数字助理” , 来触发全新的可能性 。
AI语音的下一站 , 开启人机交互的“宁静时代”
技术领域有个名词叫“宁静技术” , 简单来说就是通过对用户的情景感知能力 , 最小化用户的注意力 , 让人机交互变得隐匿和不可见(invisible) 。
就像进入电梯间之后按下楼层键一样 , 已经成为现代人潜移默化的惯性动作 , 谁还记得曾经按电梯也是一种职业 , 甚至需要考证呢 。
而人机之间的语音交互 , 也正在从“好像有点尴尬”进入到自然而然地唤起阶段 。接下来 , 就是要让这种已经在一些场景(比如客厅)成为习惯的事 , 隐匿到更大的社会空间之中 , 让AI助手能够在更广阔的商业世界里与人们自然顺畅地进行交流 。
这既是技术发展的必然趋势 , 也离不开科技企业们的不断努力 。以腾讯云小微AI语音助手为例 , 就已经在出行、文旅、教育等等领域开始落地 。
语音助手|探路人与解题者:腾讯数字生态大会上AI语音助手+X的无限可能
文章图片

文章图片

之所以能达成这一成就 , 首先来自于腾讯在语音技术上核心技术链的深耕 。
通过ASR、NLP、TTS等技术 , 对声音进行降噪、文本转化、语义理解 , 这一才能让AI助手能够在复杂环境中依然能够识别不同的方言或者口音 。
想要达成和真人一样的交流 , 机器还需要听得懂 , 才能避免“所答非所问”的情况 , 来真正帮助用户解决问题 , 成为一个业务能力强大的“数字员工” 。因此腾讯除了在语义技术方面发力之外 , 还十分重视知识图谱的建构 。等于为AI搭建了一个先验的知识库 , 让它能够及时调动庞大的知识储备 , 更好地理解用户言语的意图 , 来显示出“智商很高”的样子 。


推荐阅读