Auto|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿( 三 )


Auto|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
文章图片
△ 出门问问车载语音交互系统落地车型
两年多的时间里 , 出门问问研发了一整套离在线结合的嵌入式车载语音交互系统 , 实现了完整的语音交互 , 包括前端信号处理、固定唤醒词、自定义唤醒词、快词指令(比如车载地图控制和音乐控制命令)、语音识别、自然语言理解、对话管理、语音合成等 。
如何理解离线混合呢?我们在行车的大多数状况下 , 使用的是移动蜂窝网络 。 尽管大部分的高端车已经实现了 100% 的网络渗透率 , 但仍有很多诸如隧道等复杂的网络环境让我们处于离线状态 , 这个时候只支持在线的系统就无法即时反馈语音交互需求 。
而有了这套离线和在线的混合系统 , 驾驶者不仅能在离线情况下 , 使用车内语音交互来实现多种车控功能 , 同时也能够快速触达多项服务 。
为应对车规级的严苛标准 , 出门问问将系统内存控制在 450M 以内 , CPU 占用低 , 整体响应时间快 , 在识别效果、播报体验、响应时间、资源消耗等目标中 , 都达到了非常好的数据指标 。
值得一提的是 , 出门问问首次在前装系统中实现了全场景打断(all-scene barge-in)、自定义唤醒词、无间断连续查询(one shot)、智能等候(always on)等众多功能 , 语音交互能力获得了极大的提升 。