目前,人工智能技术的发展已经可以完成一对一的处理语音请求,但是如果面临嘈杂的环境,恐怕再智能的AI产品都会头疼。不过就在近日,《新科学家》杂志官网刊文称,美国剑桥三菱电机研究实验室的研究人员开发出的声音识别AI设备,能实时分离多个声源,大大提升了自动语言识别能力。
面对嘈杂的环境AI依旧可以通过声纹来进行区别(图片来自baidu)
据报道称,这项技术首次在日本东京先进技术综合展览会上公开展示,被团队称为“深度聚类”机器学习,可识别多个声源“声纹”中的独特功能。然后,将每个演讲者声音的不同特征组合在一起,允许它从多个声音中将特定特征的声音选出来,最后重建每个人的话语。智能技术使用了多名人士讲的英语进行了培训和学习,即便说话人是日本人,也能轻松地分辨出来。
鸡尾酒会效应(图片来自baidu)
据介绍,传统识别语音的方法,是利用两个收音器模拟听众两耳朵的位置,只能达到51%的准确性,形成的“鸡尾酒会效应”困扰AI研究几十年。
新智能系统可以将两个人的语音成功分离并重建单人语音的精确度达到90%,新技术可以帮助家庭和汽车更好地执行智能任务,一次可分离多达5个人的声音,可以用于电梯、空调机组和家用产品的智能操控。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- Counterpoint:2028年GenAI智能手机出货量将超过7.3亿部
- iPhone在华份额为何不断下滑?外媒分析:因无法提供AI服务
- 深圳中院宣告柔宇破产 曾发布全球首款消费级折叠屏手机
- Canalys:2024年Q3全球AI个人音频设备出货量达到1.26亿部 同比增长15%
- 全球个人智能音频设备Q3出货量激增15%,苹果下滑9.2%
- 中国智能手机品牌加速进军欧洲高端市场
- 华为Mate 70系列即将发布,霸占微博热搜前三
- 明基发布新款27寸2K显示器PD2706QN,首发价3499元
- PC Partner迁总部至新加坡并上市,生产基地转至印尼,继续领跑全球GPU市场
- 深耕智能家居领域,苹果计划2025年推出AI驱动的智能家居控制中心
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。