「Siri」你家的Siri和Alexa真的听懂你说的话了吗?


语音搜索 , 一个听起来充满了未来感的词 。
业界对语音搜索的发展前景一直抱持着极为关注的态度 , 互联网巨鳄对该项业务几乎皆有涉猎 。
此前全媒派编译了美国商业新闻网站The Manifest的调查分析 , 调查研究发现53%的语音搜索用户 , 其使用语音搜索的频次为每周至少一次 。
知名调研机构Com Score则预测:2020年将有50%的搜索量通过语音完成 。
这些数据似乎都指向了一个高频次语音搜索的未来 。
诚然 , 无论是对于开车、做饭等空不出手的使用场景 , 还是对于老人、视力障碍等特殊人群来讲 , 语音搜索都是一个值得期待的解决方案 。
但与此期待共生的 , 是语音搜索“听不懂人话”的用户挫败感 。 The Manifest的调查结果显示 , 仅有5%的用户表示“从未对语音搜索感到失望” 。
「Siri」你家的Siri和Alexa真的听懂你说的话了吗?
本文插图
Alexa和Google Home是承载语音搜索这一技术的主力选手 , 然而 , 它们捅的篓子也着实不少 。
一位Amazon Echo的用户Oliver就曾有过很糟糕的体验 。
由于接到邻居的噪音扰民投诉 , 警察在凌晨3点敲开Oliver的房门 , 但警察看到的并不是一场欢乐的派对 , 而是“独自一人”的Alexa——它错误地听到了播放音乐的命令 , 并“尽职尽责”地照做了 。
虽然这并不是什么数据泄露的严重事件 , 但Oliver回家的时候确实签了一笔换锁账单 。
和扰民的情况相比 , 更让人毛骨悚然的要数Alexa“凌晨的笑声”了 。 多位Amazon Echo的用户表示 , Alexa错听了类似于“Alexa, laugh”的命令 , 从而发出了笑声 。
在这场公关危机下 , 亚马逊迅速修改命令为“Alexa, can you laugh?” , 以减少此类误听情况的发生 。
由此可见 , 语音助手的智能不应该只体现在能听懂“播放音乐”的命令 , 而是应该提供更人性化的用户体验 , 毕竟凌晨3点用11档音量播放音乐的命令并不合理 。
本文将聚焦语音搜索的“尴尬”症结 , 以期呈现语音搜索的多面图景 , 以及探索可行的技术方向 。
「Siri」你家的Siri和Alexa真的听懂你说的话了吗?
本文插图
一、语音搜索难解复杂问题
同任何一种搜索工具一样 , 语音搜索并非完美 。 目前语音搜索能解决的领域主要集中在:
何人(who)、何事(what)、何时(when)、何地(where)等有具体答案的问题 , 但难以搞定为什么(why)和怎么样(how)等抽象问题 。
第一 , 复杂问题仍回归文字搜索 。
举例 , 如果Sneh Ratna想知道珠穆朗玛峰有多高、在印度班加罗尔哪里可以买到梳子 。 但她患有腕关节疾病 , 为了减少手机键入 , 因此她求助了语音助手 。
对于她的第一个问题 , 谷歌助手会立即回答“8848米” , 但对于第二个问题 , 她得到了无关的答案:
谷歌助手显示了她附近的化妆品店和美容沙龙 , Siri显示了附近的药店 , 然而这些都不是她要找的 。
“当问题变长时 , 语音助手就不理解我的话了 。 我试着把话说慢、说清楚 , 但话又说回来 , 有这个时间的话 , 我早就手动输入查找问题了 , 这样找到答案的速度要快得多 。 ”
第二 , 语音搜索擅长简单主题:琐事、天气和新闻 。
Manifest的研究发现 , 用户使用语音搜索查找的前三类信息包括:琐事和术语定义(67%)、天气(46%)和新闻(32%)等事实类信息 。
例如:杂货店营业至几点?从我家到医院诊室要花多长时间?电视节目中的这位女演员是谁?电影什么时候上映?周日球赛的最终成绩是多少?迈克尔·乔丹有多高?室外的温度是多少?
健康服务机构PHS的数字营销经理James Watkins认为 , 用户通常使用语音搜索来查找所谓的“非重要信息” , 例如天气或附近的咖啡店 。


推荐阅读