奇富科技方言识别技术亮相全球顶会INTERSPEECH 2024

9月27日消息，奇富科技受邀出席在希腊举办的国际语音通信与信号处理顶级会议——INTERSPEECH 2024，并发表了题为/Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition/的主旨演讲，全面展示了其在语音识别技术领域的成就，为中国语音技术走向世界、参与全球竞争树立了新的标杆。

奇富科技介绍了可同时支持20多种方言的新一代奇富语音识别系统“QiFree”，这是国内金融行业内字错率最低的中文语音识别系统。在中文口音与方言语音识别领域的权威测试集KeSpeech的对比中，奇富科技凭借其在自动语音识别（Automatic Speech Recognition, ASR）领域的深厚积累，实现了方言口音分类准确率的显著提升，达到了79.10%，远超KeSpeech的基线水平61.13%。同时，在衡量识别错误率的关键指标——CER（Character Error Rate, 字符错误率）上，奇富科技更是以8.08%的成绩，远优于KeSpeech的10.38%，展现了其在中文方言识别领域的高效与精准。

奇富科技“QiFree”性能效果与KeSpeech Baseline对比

奇富科技自研的中文语音识别系统“QiFree”，打破了单一模型只能识别特定单一方言的困境，通过创新的层自适应融合结构，借助共享信息编码模块更高效的提取方言信息，实现了即说即译，进一步增强了语音机器人的实时交互能力。值得一提的是，“QiFree”不仅在普通话识别领域的CER上保持领先地位，更在冀-鲁、江淮、胶-辽、兰-银等多个方言区域的识别性能上，相比过往最佳成绩实现了超过15%的显著提升。这一突破性成果得到了INTERSPEECH三位独立审稿人的高度认可，他们一致认可奇富科技论文《Qifusion-Net：基于特征融合的流式/非流式端到端多口音语音识别框架》所展现的系统框架创新性与识别性能的卓越表现，并一致授予其“ACCEPT”的评定。

资料显示，INTERSPEECH是全球语音科学界最负盛名的年度会议之一，汇聚了来自世界各地的顶尖学者、研究人员及行业领袖，共同探讨语音技术的最新进展、挑战与未来趋势。这一平台不仅代表了语音技术领域的最高学术水平，也是新技术、新理念交流与碰撞的绝佳场所。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。

奇富科技方言识别技术亮相全球顶会INTERSPEECH 2024

下一篇