网易 AI Lab 荣获INTERSPEECH 2020 双料冠军

近日,全球最大的语音会议 INTERSPEECH 2020 公布了 SdSV 声纹识别比赛成绩,网易 AI Lab 从众多国际顶级队伍中脱颖而出,获文本相关声纹识别赛道综合排名第一、单模型第一的双料冠军。此次获奖,彰显了网易 AI Lab 在语音声纹识别技术领域的领先地位。

INTERSPEECH会议是全球最大的综合性语音信号处理领域的科技盛会,业内享有极高的声誉,对参与企业有着严苛的准入门槛要求。本次国际声纹识别比赛的参赛队伍来自国际多家知名高校与企业,包括近两年全球各项声纹识别比赛中的“常胜将军”:布尔诺工业大学、新加坡通信研究院、约翰霍普金斯大学等。

比赛采用 MinDCF(最小检测代价)和 EER(等错误率)作为评测指标。网易 AI Lab 的单模型在两个指标均为最佳,其中 EER 达到了 1.67%,相比第二名降低了 11.6%,并远低于比赛 X-Vector 基线系统(EER=9.05%)。

除了在综合指标上的领先外,网易 AI Lab 基于常见的 X-Vector 和 PLDA 算法,创新地提出了一种 ASR-free 的文本相关声纹识别算法。相比传统的 Deep Speaker Embedding 方法,该算法不需要依赖语音识别, 就能够在多语言环境下,同时完成说话人和文本内容的验证。

声纹识别技术以往多应用于安防等场景中,而网易 AI Lab 则创新性的将声纹识别技术与游戏场景结合,除了进行游戏身份验证,还能够针对音色对用户进行分类、丰富玩家画像,从而更加精准地为玩家推荐志趣相投的好友、匹配实力相当的对手,为玩家带来更好的游戏体验。

积极探索人工智能技术与应用场景的结合,是网易布局人工智能的重要方向之一。近日,网易CEO丁磊也在2020世界人工智能大会上表示,人工智能不是技术问题,是应用场景问题。

网易 AI Lab 荣获INTERSPEECH 2020 双料冠军

近几年,网易结合自身业务,在计算机视觉和智能语音语言方面做了多项应用场景的落地。比如,去年《一梦江湖》与网易互娱AIlab合作推出全新功能——AI智能捏脸。该功能通过人脸特征的映射采用“人脸属性识别”和“自适应参数映射”技术,将人脸视觉特征与捏脸参数相汇通。AI捏脸不仅会保留照片原有的五官、形状、布局,还会保留照片上例如微笑、悲伤等细节神态,使脸型传神又真实。用户只需上传一张真人照片,就可以获得便捷、智能、多元化的捏脸体验,该玩法一经推出,便受到许多用户欢迎。

（免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。）