「科技典范」小度站稳行业制高点,智能音箱打响芯片战役:百度鸿鹄芯片助攻( 二 )


2、交互体验:方式更多+效果提升并行
交互体验包括两个方面 , 一是交互方式的丰富 , 二是交互效果的提升 , 两年时间 , 智能音箱两条腿走路 , 框架和深度能力都已经建立 。
在交互方式方面 , 2019年7月 , 小度在家上线全双工免唤醒能力 , 意味着智能音箱进入全双工语音交互时代;此外 , 横向类型上 , 12月智能屏X8的推出 , 也是远场语音交互、人脸识别、手势控制、眼神唤醒多种交互方式碰撞的体现 。
快速识别“童脸”、手势隔空控制播放/暂停、一个眼神唤醒……在智能音箱上 , 用户的交互选择越来越多 , 也越来越随意和自然 。
到了2020年 , 交互方式还在发生新的变化 , 3月初小度音箱上线了语音定制功能 , 即通过某些简单的操作让智能音箱的音色变成自己或家人的声音 , 这使得智能音箱成为更有亲和力的产品 。
当然 , 在交互方式升级过程中 , 行业的追逐仍然存在 , 多样化的交互方式继小度后都逐步成为各家的标配 , 而小度语音定制功能推出后不久 , 小米也发布了自己的定制功能 。
而在交互效果的提升方面 , 进步一直有 , 但大跨步的进步 , 可能要等到这次小度搭载百度自造芯片才算 。
根据百度实验室的测试结果 , 在安静环境2.5米距离内 , 小度智能音箱2红外版360°识别字准率达99% , 这一数据比第一代小度智能音箱高2% , 比市场上其他品牌智能音箱产品高10% , 而句准率95%更是高出竞品24%;在家庭电视噪声环境2.5米距离下 , 这一对比更加明显:小度智能音箱2红外版360°识别字准率95%、句准率88% , 分别较竞品提升了40%、75% 。
「科技典范」小度站稳行业制高点,智能音箱打响芯片战役:百度鸿鹄芯片助攻
文章图片
智能音箱的交互效果提升 , 可能藉由芯片 , 在一个新的高台重新开始 。
3、内容服务:颗粒度竞赛完成初步赛程
不得不承认的是 , 在小度在家刚刚推出时 , 产品形态仍然是创新和竞争的主基调 , 因而内容服务不算深入 。
官方当时称“集成了海量音乐曲库及热播剧集电影综艺节目 , 有1400万个百科知识 , 搭载爱奇艺电影和百度音乐等” , 以现在的目光看 , 不算太丰富 。
对比当前小度智能音箱全系产品的内容服务:
覆盖游戏娱乐、医疗健康、教育、购物、社交、生活服务等场景 , 有快手、抖音、B站、优酷、全民K歌、喜马拉雅、荔枝直播等热门内容源 , 满足0-12岁儿童群体、90后/95后Z世代人群、中老年人群等不同年龄阶段需求 。
「科技典范」小度站稳行业制高点,智能音箱打响芯片战役:百度鸿鹄芯片助攻
文章图片
过去两年 , 以小度为代表 , 智能音箱的内容服务呈现由单场景到多场景、来源越来越多样化(例如小程序)的颗粒度细化路径 , 到智能屏X8开始 , 由于内容服务生态被定义为品类的构成要件之一 , 智能音箱的内容服务快速完成了全年龄、全场景、全功能(主要指快递、外卖、购物等生活服务)的框架构建 , 后续的颗粒度细化将进一步加速 。
回过头来看 , 智能音箱在产品形态、交互体验以及内容服务都完成了某种阶段性的发展进程 , 最基础的底层硬件却一直没有大的突破 。
在小度智能音箱2红外版之前 , 小度全系产品与行业其他玩家一样搭载的是ARMCPU解决方案 , 这是一种物联网通用CPU架构 , 从技术上说 , 运行AI算法还需要某些转换过程 。
「科技典范」小度站稳行业制高点,智能音箱打响芯片战役:百度鸿鹄芯片助攻
文章图片
百度鸿鹄打通数字信号处理与语音识别实现端到端一体建模识别 , 改变了智能音箱需要借助通用芯片方案的尴尬处境 , 作为原生适应AI语音算法的芯片 , 对上述产品形态、交互体验、内容服务进行更大发挥有不言而喻的价值 。
软件的进步永远是性能榨取式的 , 只有硬件才能根本上实现质的飞跃 , 芯片是智能音箱“智能拼图”不可或缺的一块 , 百度鸿鹄把它补上了 , 但这仅仅是个好的开始 。


推荐阅读