Siri:“Hey Siri” 背后的黑科技大揭秘!
本文插图
来源:CSDN
本文约1993字 , 建议阅读4分钟
本文介绍Siri的前身 , 工作方式以及背后的算法 。
本文插图
以下是译文:
如今苹果手机可随时检测并回答“Hey Siri”命令 , 有人可能会想 , 它是不是在随时记录我们的日常生活对话呢?
答案是否定的!
“Hey Siri”能做的并没有我们想象的那么多!
让我们先看看“Hey Siri!”的发展历史吧 。
“Hey Siri!”作为预装语音助手Siri的附加功能 , 于2014年9月在iOS 8中发布 。 然而 , 在iOS 9(2015年9月)它升级了 , 只允许被用来识别用户的个性化语音 。
而谷歌助手在2013年之前就已经有了这个功能 , 但是 , 在你的屏幕关闭时 , 它不能支持这个功能 。 即使是现在 , 很多安卓手机都不支持这个功能 。
让我们来比较一下用户体验 , 如下图所示:
本文插图
常规方式 vs.“Hey Siri!”
常规方式是这样的:用户拿起手机 -> 长按home按钮 -> Siri启动 。
而在“Hey Siri!”方式下 , 用户只需说“Hey Siri!” , 无需按键 , 就可以让Siri启动 。
这样有一个好处是 , 因为当用户不方便使用手操作(如开车时) , 用户也可以使用手机的一些功能 。
Siri的前身:M9运动协处理器 “协处理器”可以理解为具有有限功能和电池消耗的辅助处理器 , 用来支持即使在手机空闲(屏幕关闭)时也可以访问“始终开启”的功能 。
M9运动协处理器是苹果协处理器家族的第三代产品 , 于2015年9月与iPhone 6s一起推出 。 得益于它基于ARM、64位的A9片上系统所具有的强大的处理能力和微量的电池消耗 , 这个苹果手机著名的“唤醒”功能才得以实现 。 M9有时也被人们描述为“嵌入到运动协处理器上的始终在线处理器(AOP - Always on Processor)”
“Hey Siri!”是如何工作的? 当你第一次启用这个功能时 , 它会提示你说一定次数的“Hey Siri!” 。 然后你的iPhone将这些声音保存起来 , 用做将来识别你的个性化声音的“触发键” 。
这个个性化的“触发键”保存在协处理器中 , 即使你的手机处于空闲状态 , 协处理器也会侦听(而不是听到)落到麦克风上的所有声音 。
本文插图
因此 , 当声音落在麦克风上 , 并与“触发键”匹配成功后 , 协处理器就会激活主处理器开始录音(就像我们长按主屏幕按钮打开Siri一样) 。 然后 , 该录音被发送到服务器 , 并以类似于每个语音助手的过程进行解释 。
想象一下这个过程 , 就好像你拥有数千把钥匙 , 你正试图找到哪把钥匙正好匹配你要打开的锁 。
这里要注意的重要一点是 , AOP处理器(A9)总是在“侦听”而不是“听”用户的声音 。 它就像一个婴儿 , 他一直在听人说话 , 但无法完全处理听到的话 , 只有在呼唤他的名字时 , 它才会被触发而开始工作 。
M9运动协处理器于2015年9月与iPhone 6s一起发布 。 但正如本文一开始所说 , “Hey Siri!”功能早于2014年9月就已经推出 。 那么 , 早期版本的iPhone 是如何能够“被动地”侦听呢?
好吧 , 如果你碰巧认识一个拥有iPhone 6的人 , 你可以检查一下“Hey Siri!” 。 即使你的手机处于空闲状态(屏幕关闭) , 该功能也只能在充电模式下工作 。 正如我们可以简单地推断的那样 , 它仅仅能在充电时获取少量的额外电量 。 看看下面iPhone 6 Siri的设置截图:
推荐阅读
- 『像素』荣耀潮流情报局:揭秘荣耀30系列预热视频背后的故事
- 【语音】Siri不够聪明,再给它一双眼吧!CMU与苹果合作,摄像头让AI助手更精确
- 『粤新房客』如果人类在太阳系中发现了比自己更落后的文明会怎样?
- 【什么值得买】24 期免息四舍五入等于不要钱?进化后的 Galaxy Buds+ 开箱及轻度体验
- [马云]卸任后的马云只拥有7的股权,为何却仍可以控制阿里
- 『极客公园』罗永浩和刘作虎,一场直播背后的故事与想象
- 『』AI 最前沿 | NVIDIA 技术专家带你探索自动驾驶背后的科学
- 「」iOS13.4.5 Beta2 系统推出,时隔两周后的更新
- 直播:对话海澜集团总裁:一场小程序直播300万观看背后的秘密
- 用户@行业寒冬月活用户千万级,深扒分期乐、360借条APP背后的运营策略
