声纹识别(Voiceprint Recognition,VPR)也称说话人识别,是一种通过声音判别说话人身份的技术,分为说话人辨识和说话人确认。前者用以判断某段语音是若干人中的哪一个所说的,即“ N 选一”;后者用以确认某段语音是否是指定的某人所说,是“1对1匹配”问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需用到确认技术。
云知声在声纹技术领域深耕多年,是国内为数不多具备全栈语音技术能力的人工智能公司。早在 2004 年,尚就职于摩托罗拉公司的云知声创始人黄伟博士便带领团队研发出世界上第一款手机声纹认证系统,搭载该系统的相关产品总计销量超 2 亿台。
虽然声纹识别优势明显,但要想准确分辨声音特征却并非易事。首先,声纹识别系统性能会受用户发声状态影响,如用户的身体状况、情绪等都会影响识别准确度。其次,环境的嘈杂度,以及采集、传输音频的硬件配置,都会在不同程度上对识别系统行成干扰。为解决上述问题,云知声声纹技术团队进行了一系列技术攻坚与创新。
首先,依托云知声强大的语音信号前端处理技术,如 VAD、语音降噪等,准确地捕捉到人声并进行背景噪声消除。
其次,云知声将 DNN 引入到传统声纹识别 ivector 技术框架中,并融合最新端到端声纹识别技术,基于云知声超算平台和海量声纹训练数据,使得模型得以学习到数万说话人,每人多种发声的特性,且在云端针对每个用户采用说话人自适应技术,达到越用越好的效果。在信道处理上,采用 PLDA 信道补偿技术,可将信道影响降到最小。
近年来,伴随深度学习的兴起,云知声在国内率先将深度学习技术使用到语音识别中,且后续引入到声纹识别领域,解决了一系列声纹技术实用难点,并应用到实际产品上。
在1月7日政法委“新时代市域社会治理智能应用交流展”上,云知声在公检法领域的声纹身份验证和反欺诈方案得到了各级政法委领导的高度赞扬,表示这才是真正的“智治”,让AI成为政府和社会组织实施精准治理、智能治理的重要利器,协助公安部门减少案发、更快破案,为平安城市保驾护航。
近日,中国领先的一站式医疗健康生态平台平安好医生宣布,由云知声提供声纹技术支持的平安好医生客户端“声纹登陆系统”在经过多次模型优化和升级迭代后,登陆成功率接近99%,达行业一流水准。
与此同时,为保障用户登陆的“安全性”,云知声为平安好医生客户端声纹登录系统提供数字串注册和登录的“文本弱相关”技术,工程难度更高,安全性更强。在同一账号下,云知声声纹识别产品可支持 6 人注册。在客户端云知声提供封装好的 SDK,支持声纹注册、登录、解绑等接口,供上层调用 API 实现产品逻辑。
此外,云知声与国家电网合作的会议系统声纹识别项目更是实现了10人以内声纹库识别率高达90%以上。此系统采用云知声最先进的声纹识别、语音识别技术,准确识别会议中的发言人身份和发言内容,形成完整会议记录,方便归档、追溯,实现会议全过程的数字化,推动会议管理的智能化发展。
同时,云知声还提供成熟的声纹服务私有化部署方案,基于在金融、客服、快递等不同行业丰富的私有云部署经验,可有效保障客户数据安全。未来,云知声将更成熟、更先进的声纹技术与产品应用到金融、医疗、教育、公检法等领域。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 本田与日产酝酿合并:明年6月敲定协议,新公司社长待本田推荐
- 金融大模型新突破:百川智能Baichuan4-Finance引领行业,准确率领先GPT-4近20%,变革金融业未来
- 博通CEO陈福阳回应:忙于AI半导体业务,暂无意收购英特尔,拒绝巨头诱惑?
- 法拉第未来再获融资,下月亮相首款原型车,或将开启新篇章
- 央视揭露:未成年租号游戏乱象,防沉迷形同虚设,需警惕
- 三星内存部门发放超级绩效奖金,最高涨薪200%,员工福利再升级
- LG新能源南京总部启动,智能电池生产引领绿色未来
- 东芝涅槃:退市裁员后重回盈利,改革之路如何重塑辉煌?
- 大众汽车管理层降薪风暴:奖金缩水,未来两年减薪10%,求真还需看业绩表现
- 知乎预测未来:黑神话悟空领衔,诺贝尔物理学奖成焦点
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。