量子位|全球权威声纹识别竞赛斩获双料冠军 网易AI Lab智能技术领先国际
允中 发自 凹非寺
量子位 报道 |QbitAI
中国力量 , 又双叒夺冠了 。
这一次 , 是在全球规模最大、最全面的语音顶会INTERSPEECH 2020上 。
挑战比拼内容 , 则是当前语音研究领域最火热的议题之一——“声纹识别” 。
最新公布成绩的SdSV声纹识别比赛中 , 网易AI Lab从众多国际顶级队伍中脱颖而出 , 获文本相关声纹识别赛道综合排名第一、单模型第一的双料冠军 。
本文插图
SdSV声纹识别比赛是业界权威性赛事 , 参赛队伍来自全球多所知名高校与企业 , 包括近两年全球各项声纹识别比赛中的“常胜将军”:布尔诺工业大学、新加坡通信研究院、约翰霍普金斯大学等 。
能在与众多好手的较量中脱颖而出 , 网易AI着实秀了一把技术“肌肉” 。
网易AI如何夺冠?
SdSV Challege 2020的主要目的 , 是评估在短时场景下针对文本相关(TD)和文本无关(TI)说话者验证(SV)的新技术 。
今年 , 全球共有67支队伍注册参与挑战 。
本文插图
比赛中 , 网易 AI Lab基于常见的X-Vector和PLDA算法 , 创新地提出了一种ASR-free的文本相关声纹识别算法 。
相比传统的Deep Speaker Embedding方法 , 该算法不需要依赖语音识别 , 就能够在多语言环境下 , 同时完成说话人和文本内容的验证 。
比赛采用MinDCF(最小检测代价)和EER(等错误率)作为评测指标 。
网易AI Lab的单模型在两个指标均为最佳 , 其中EER达到了1.67% , 相比第二名降低了11.6% , 并远低于比赛 X-Vector基线系统(EER=9.05%) 。
网易AI Lab
这样的好成绩 , 对于网易AI Lab来说 , 并不是福至心灵的运气 , 而是确有长期的技术积累 。
本文插图
声纹识别是生物识别技术的一种 , 也称为说话人识别 , 是一种通过声音判别说话人身份的技术 。
目前 , 人工智能主要有三个研究方向:视觉识别、智能语音、NLP自然语言处理 。
其中 , 在语音研究领域 , 声纹识别属于相对蓝海市场 , 解决的主要是“我是我”的身份认证问题 , 多应用在安全验证场景 。
从近几年的市场趋势来看 , 银行 , 金融服务 , 保险已成为声纹识别应用的领导领域 。
可以说 , 随着技术的不断成熟和融合 , 声纹识别技术正在逐渐融入日常生活 , 像指纹识别、面部识别一样成为人人触手可及的AI技术 。 应用潜力巨大 。
本文插图
而成立于2017年的网易 AI Lab , 早已将声纹识别技术运用到了游戏场景中 。
除了进行游戏身份验证 , 还能够针对音色对用户进行分类、丰富玩家画像 , 从而更加精准地为玩家推荐志趣相投的好友、匹配实力相当的对手 , 为玩家带来更好的游戏体验 。
目前 , 网易AI Lab在杭州、广州、上海均设有分部 , 主要运用AI黑科技为旗下各大游戏工作室助力 , 并赋能给更多产品 。
【量子位|全球权威声纹识别竞赛斩获双料冠军 网易AI Lab智能技术领先国际】总的来说 , 网易AI Lab的研究方向包括三大方面:
计算机视觉和图形学研究
语音语言处理研究
游戏AI研究
当前 , 已有不少研发技术处于行业领先地位 , 并接入了多款游戏 。
在前不久刚刚落幕的2020世界人工智能大会上 , 网易CEO丁磊曾表示 , 人工智能选对了应用场景 , 发挥的效率就会非常高 。
推荐阅读
- 人工智能|济南将打造全球首个人工智能医药研发自动化实验室
- 科技创新|2020西安全球硬科技创新大会9月启幕
- 行业互联网|李炳忠15点正式官宣,realme成立2年,稳居全球第七!
- 青年|「行走自贸区」自贸区+电商综试区!曹妃甸综保区助你“嗨购全球”
- 海外情报社|明明是国产,偏要取个英文名,被误认为是洋货,却领先全球十年
- |美国宣布投资10亿美元成立12家AI和量子研究所
- |将量子计算机当作神经网络,首次模拟化学反应,谷歌新研究登上Science封面
- 无人科技|LightWare发布全球最小的微型激光雷达:SF000
- 人工智能|全球行业领先 成都双流发布首款自主研发人工智能物联网“芯片”
- 互联网|首届全球5G产业创新峰会在四川成都举行
