科技小数据 原来背后有这些原因,车载语音越来越好用了

文章图片
不难发现 , 现在「车载语音交互」的体验越来越完善 。 它不仅能完成更多的指令 , 而且能和我们进行情感交互 , 甚至还懂得一些基本的伦理纲常 。
【科技小数据 原来背后有这些原因,车载语音越来越好用了】那现在语音体验发展到哪一步了?实现这样的体验都有哪些路径?这些路径之间有什么不同?为什么我们的体验越来越好?下面我们带着疑惑 , 一一讨论这些问题 。
现在的语音系统体验怎么好了?
首先语音的基础能力更强了 。
之前虽然能完整跑通ASR、TTS这些流程 , 能实现一些简单的NLU/NLP能力 , 但体验有很多漏洞 , 比如有可能识别失败 , 指令完成缓慢 , 交互逻辑不合常理等等 。 现在来看 , 这些基础能力正变得更强 , 基本可以称得上是一个「有价值的工具」 。
具体表现有 , 能够支持打断 , 支持多轮对话 , 支持上下文理解 , 支持中英文混合理解 , 可以自动纠错 , 支持免唤醒 , 误触率降低 , 反应速度增加 , 能够识别更轻的声音 , 能够输入更长的对话 , 能够理解一条语音多指令 , 能够理解一些普世的伦理逻辑……
说到底这些基础能力只是一种交互模式 , 是一种手段 , 真正要实现价值需要结合应用和生态 。 所以现在的车载语音还将触手伸向了更多领域:
1.将语音和软件功能结合 。 比如和操作系统结合 , 和地图导航结合 , 和车机上所有的应用生态结合 , 和市面上主流的Feed流结合 。 举个例子 , 你可以说「屏幕亮一点」 , 「回到主页」 , 「打开XX地图」 , 「我想听周杰伦的歌」 , 「搜索附近的充电站」 , 「苹果今天的股价是多少」 , 「林则徐是谁」等等 。 和多种应用结合其实是个很大的突破 , 可以想想 , 至今Siri都不能完成「我要听XX的歌」这样的指令 。
2.将语音和硬件设备结合 。 这里是指控制车内的一些硬件 , 比如开闭空调、车窗;和其他的智能设备结合 , 比如车控家 , 智能手表等等 。
另外近几年还衍生出了虚拟助手的概念 。 这对完成指令本身没有帮助 , 但在感性层面 , 它往往非常能打动消费者 。 一个合适的虚拟形象 , 往往会成为这套车机系统 , 甚至这款车的加分项 。

文章图片
同样的语音体验
不一样的实现路径 , 不一样的想象空间
可喜的是 , 现在确实已经有一部分车型 , 或完全或部分实现了上面这些功能 。 但它们的实现路径其实不太一样 。 下面我介绍3种 。
1.使用BAT的车联网方案 , 搭配对应的语音能力 。
肤浅来说 , 现在车机系统最明显的表现就是搭载各项互联网应用 , 比如高德地图/QQ音乐/车载微信/爱奇艺等等 。 所以BAT现在都有一套比较通用化的自家生态方案 , 里面有不同的功能模块 , OEM可以选择「打包上车」 , 这其中就包括车载语音系统 。
自家的生态 , 配上自家的语音 , 那肯定体验会更好一些 。 拿腾讯来说 , 他们推出了微信车载版 , 在腾讯叮当提供的语音下 , 我们收发微信语音非常流畅 。 另外腾讯还有一个产品叫「腾讯随行」 , 配合腾讯叮当收发微信位置 , 打开小程序 , 也很流畅 。 「爱趣听」也是一样 。

文章图片
当然 , 腾讯也会辅助开发系统 , 给予Feed流支持 , 做一些NLU的开发 , 所以和腾讯合作的车机系统(比如哈弗F5搭载的Fun-Life)基本都能实现我们上面说的那些功能 。 同理 , 百度(DuerOS)和阿里(斑马系统)的方案也可以 。
不过 , 虽然BAT都能实现上述功能 , 但他们还有一个共通点就是基本无法实现「全流程开发」 。 也就是说车内基础的ASR和TTS能力可能是由其他语音供应商提供 , 而BAT负责语音控制生态以及其他相关NLU的工作 。
推荐阅读
- 小畜播报|于小彤陈小纭疑似分手?删除动态,原来早有预兆!
- 科技一哥|荣耀30青春版图集赏析:触觉与视觉的完美享受
- 科技犬君|vs 索尼A9G 谁强?,上半年用户喜爱手机盘点;小米电视大师65英寸OLED
- 精选泛科技|结果如何?,一加8续航遭质疑:上半年最全机型横评出炉
- 科技犬君上半年用户喜爱手机盘点;小米电视大师65英寸OLED vs 索尼A9G 谁强?
- 科技生活快报TB5000mAh大电池还有65W超级快充!这些手机让你摆脱充电焦虑
- 精选泛科技一加8续航遭质疑:上半年最全机型横评出炉,结果如何?
- 阿拉图图科技说三星新机口碑虽好,但中国市场销量翻车,用户几乎跑光!
- 华为Mate30美科技界:华为再强大也只是一家民企,我们究竟在怕什么?
- 行业|高增长+高回撤!请收好这份“补票”名单,11只核心资产股入围,百亿科技股已跌出“深坑”
