「Siri」你家的Siri和Alexa真的听懂你说的话了吗?( 二 )


如果答案不正确 , 那也不会带来太大的不便和损失 。 向语音助手询问天气是一种低风险的搜索 , 如果答案有误 , 可以使用传统的搜索方法进行验证 。
二、出其不意的误解和回应
尽管称其为“人工智能” , 但语音搜索作为一个程序 , 仍然在问题的理解上有着固定的程式 , 产生的误解也层出不穷 。
在Reddit论坛上 , “Alexa不懂我(Alexa misunderstanding me)”的主题下面有着众多吐槽 , 附议跟帖的用户也不在少数 , 读来颇让人有些哭笑不得 。
我(悄悄):Alexa , 我明天的闹钟设的几点?
Alexa(最大音量):我认为你刚才在对我说悄悄话 , 从现在开始当你对我悄悄说话时我也会用悄悄话回应 , 你可以说“关闭悄悄话模式”来关闭这一功能 。 (悄悄)明天没有设闹钟 。
(差点把我全家都吵醒了???)

「Siri」你家的Siri和Alexa真的听懂你说的话了吗?
本文插图
Twitter上的此类吐槽也是常态 , 甚至有人会在语音助手的话题词后面打上#stupid的标签 。
——有趣 , 我刚让Siri把我的导航APP关了 , 结果她回复我怎么手动关掉APP……(要关闭一个APP , 请从手机底部向上滑……)Siri , 我在开车啊 , 你的工作难道不是直接关掉这个APP?
——我问Siri下一届冬奥会是什么时候 , 它回复了我挪威在上一届冬奥会获得的奖牌数 。 谢谢你 。
三、语音助手的“迷之唤醒” , 缺乏语境理解
Joshua Liljenquist是明尼苏达州立大学的大四学生 。 他仍然记得大二那年 , 有一次教授走进教室 , 正准备开始讲述教学大纲 , 这位教授禁止学生在上课期间拍照做笔记 , 否则要开除学生 。
Liljenquist很震惊 , 低声对他旁边的人说 , “这家伙有点……”而就当教室里一片寂静时 , 突然 , Liljenquist的Siri试图“提供帮助” , 它说:“我找不到关于‘这家伙有点……’的结果 。 ”
“我牛仔裤上捏出的一条褶一定是Siri弄出来的 。 我的脸变得通红 , 想抓起我的东西冲出教室 , ”Liljenquist表示 , “Siri应答的时机简直不能再糟糕了 。 ”
Liljenquist并不是特例——64%的语音搜索用户都曾意外唤起过语音助手 。
“虽然过去几年深度学习取得了巨大进步 , 软件比以往任何时候都能更好地理解语音和图像 , 但仍然存在很多限制 。 ”社交软件Conversocial的创始人Joshua表示 。
“虽然语音助手可以识别你说的话 , 但它们并不能真正理解背后的含义或意图 。 人类世界很复杂 , 如今的人工智能系统都还只能处理非常具体、狭隘的问题 。 ”
例如 , 我们人类有很多方法来确定某句话是冲我们说的 , 比如语气 , 或者说话人注视方向等视觉上的线索 。
然而 , Alexa预设任何包含“A”字的句子都是在对它下指令 , 这也是用户经常意外触发的原因 。
「Siri」你家的Siri和Alexa真的听懂你说的话了吗?
本文插图
四、语音搜索将何去何从?前景预期&技术探索
1952年 , 贝尔实验室(Bell Labs)的语音识别系统奥德丽(Audrey)问世 , 这是第一台能够理解语音的机器 , 虽然只能识别0-9个数字 。
至今 , 语音搜索已经取得了长足的进步 , 但上述每一个或搞笑或无奈的故事都提醒着我们 , 这一技术仍有提升的空间 。 不过我们也可以看到 , 研究人员的优化进程正在迅速推进 。
第一 , 机器学习“更懂人话” 。
人工智能和机器学习皆在进步 , 这对我们与智能设备的交互、我们在互联网上的搜索方式都产生了巨大的影响 。
谷歌的Rank Brain就是一个很好的例子 , 它重点在识别单词和短语上 , 以期学习和更好地预测输出 。
当Rank Brain遇到一个它以前从未听说过的短语时 , 它实际上会对搜索者的意思和意图做出最好的“猜测” , 然后提供适当的匹配答案 。 这种“思考”的能力使诸如Rank Brain之类的AI , 在处理意外搜索查询方面更加有效 。


推荐阅读