「AI」AI录音笔一战成名!搜狗以语言AI为核心重点突破多点开花( 二 )
以语言为核心布局AI , 搜狗众多黑科技相继落地
沉寂多年的录音笔市场因S1再次成为热点 , 让搜狗在智能录音笔行业再下一城 , 与搜狗“以语音AI为核心”的战略布局是分不开的 。
其实 , 搜狗早就开始了AI领域的布局 , 并拥有众多的AI软硬件落地产品 , 软件技术包括搜狗同传、AI录音笔的自由对话翻译、输入法变声、AI合成主播、一站到底汪仔的智能问答技术等 。
输入法+变声:用马云的声音和好友聊天
AI 变脸变声早就有了 。 但是将 AI 变声功能整合到输入法中 , 绝对堪称是搜狗的一次绝佳创意 。
以往的变声方式非常繁琐 , 不仅额外下载 app , 两个 app 之间还得来回切换 。 搜狗将变声融入到输入法中 , 用户不需要跳出当前的对话就能够即时变声 。
普通的变声软件只是简单的更改了音频 , 比如将用户的声音变细来模仿萝莉 , 变粗来模仿大叔 。
图片
而搜狗知音的语音技术团队则是从语音表征学习、语音合成等领域切入 。 用表征学习来学习源端说话人的音色、内容、韵律这三大特征 , 再利用语音合成技术 , 将源端说话人的特征和要转换的角色特征合成为最终变声音频 , 达到各个方位的相似和自然 。
如此一来就打破了音色转换的局限 , 用户可以变声成特定的角色声音 , 比如王者荣耀里的妲己、海绵宝宝 , 甚至马云 , 并且还原度极高、自由空间大 。
图片
多模态语境同传:机器同传首次实现会看、能理解、会推理 , 正确率提高 40%
同一个词 , 放在不同的语境下意思可能截然相反 。 例如 LOL , 在聊天的时候它即可能表示 laugh out loud , 也可以表示 Lords of Legends , 需要结合当前的语境来判断 。
类似的理解错位 , 在同传的时候非常影响与会者对演讲者内容的理解和参会体验 。 搜狗推出的首个具备多模态认知能力的同传系统 , 首创了“语境引擎” , 在搜狗同传“听”的基础上 , 增加了“看”和“能理解会推理”两项新技能 , PPT 内容翻译正确率提高 40%! 
图片
通过“看”来自主学习演讲者的演示内容 , 再通过“理解”和“思考”讲演讲者的内容 , 更加准确的识别并翻译出来 。 再一次引领了行业的技术进步! 
图片
不光有声还有影:AI 合成主播 , 不仅能报新闻还能当法官
2019 年 3 月 3 日 , 全球首位 AI 合成女主播在央视正式上岗 , 引发全球热议 。
图片
该主播使用了“搜狗分身”技术 , 通过模拟人说话时候的声音、动作、表情、肢体语言等 , 让 AI 合成主播看起来更像一个真人 , 可以来回走动 , 肢体还会配合说话的内容做出相应的动作 。
搜狗甚至还推出了 AI 虚拟法官 , 通过北京互联网法院的在线智慧诉讼服务中心为民众提供更为便捷、高效的线上诉讼服务 。
春节前夕 , 搜狗将分身技术应用到输入法 , 用户可以直接打字过程中 , 直接让虚拟气象主播“雅妮”实时播报天气 。
更重要的是 , 搜狗分身技术在国内外尚属首例 , 终于有一个国人独有的技术了!
搜狗汪仔:研发 9 个月耗资 4000 多万 , 江苏卫视《一站到底》一战成名
2 年前 , 搜狗汪仔就在江苏卫视的智力挑战节目《一站到底》大放异彩 , 以 0:3 开局 , 最终却以 8:6 获胜 , 让现场的所有人包括电视机前的观众都震撼不已 。
推荐阅读
- 『人工智能』芯片设计软件EDA霸主,新思科技下一战瞄准AI丨亿欧解案例
- [砍柴网]职场效率升级必备,搜狗 AI 录音笔 S1 让声音成为“生产力”
- 『闪充』打好王牌独立第一战!Ace2或搭载最强充电组合,业内仅此一份?
- ##最强手机出炉!最强芯片+最强系统+最强屏幕,谁可与之一战?
- 说一说手机@最强手机出炉!最强芯片+最强系统+最强屏幕,谁可与之一战?
- []学生党必看:和笔记本电脑一样重要的学习工具是搜狗录音笔!
- 『』麒麟820跑分出现,远超骁龙765G,只有联发科天玑1000L可一战
- 【】做电商直播是罗永浩输不起的最后一战?本人这样说
- 「」罗永浩终归知天命:统领千万罗家军入侵电商战场,这不是最后一战
- 联发科@联发科冲击“高端”的最后一战!这三款天玑1000的机型能否逆袭?
