4月1日消息,奇富科技推出新一代全自研智能语音模型——QI语精灵。据悉,这款模型不仅能用方言与人自然交流,还能在智能营销、贷后提醒、风险控制等金融业务场景中,提供高准确率的语音识别和转写服务,让金融服务沟通更添温度。
QI语精灵以Conformer结构为基础,设计了一个轻量高效的语音识别模型,大幅降低了模型的部署成本,并能轻松应对高并发的业务需求。其双重解码方案,即将语音识别和意图识别两大核心环节紧密结合,确保在各类复杂场景下都能达到行业领先水平的表现。具体而言,QI语精灵在复杂通话环境下的语音识别综合准确率超过93%,无论是标准的普通话还是方言口音都能精准捕捉并转写成文字。而意图识别同样表现出色,识别准确率超95%,能快速且准确地解析用户需求并作出响应。
值得一提的是,QI语精灵在贷后客户沟通服务中取得了显著的成绩。与前一代技术相比,其在语音转写准确性上实现了大幅提升,单字错误率降低了45%,同时,相关的下游意图识别技术指标也有超过30%的增长。此外,通过AB测试显示,QI语精灵在提升客户响应效率方面成效显著,特别是在账户余额调整提醒后,对于通常需要关注的账户状态更新,QI语精灵帮助实现0.79%和0.54%的效率提升。
QI语精灵在方言识别方面展现出显著的独创性与技术优势。传统的方言识别模型受限于地区先验条件,需预先知晓方言种类才能准确识别;然而,QI语精灵却打破了这一局限。它依托全自研的Qifusion结构,无需方言种类的先验条件,便能直接进行精准的识别和转译。这一创新不仅实现了对全国8种主流方言口音的全覆盖,更能在多任务学习框架下,通过精准融合帧级别的方言信息,使得QI语精灵在方言口音数据集上识别准确率高达90%以上,达到业界领先水平。
奇富科技在人工智能语音领域进行了持续研究与开发积累。《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》、《基于多粒度Transformer的多模态情绪识别》和《基于SE模块和多尺度特征学习的语音情感识别》等多篇论文被ICASSP和 INTERSPEECH两大顶级语音领域的国际学术会议连续收录。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 毫末智行回应裁员:正常组织调整,比例很小
- 谷歌恐难逃分拆命运:即将迎来特朗普大苦主
- 余承东:尊界车长约5.5米 尺寸可能超越马路上99.99%的轿车
- 逾10年潜心自研芯片创新,亚马逊云科技Graviton在新实例中已打下三分天下
- 长城汽车CTO否认“与华为合作”传闻:对自己的智驾技术相当有底气
- 接入混元大模型 腾讯搜狗输入法讲起AI新故事
- 张朝阳谈互联网创新:创新不仅是创造力的体现,更是实践落地后的成功
- 阅文集团:《庆余年》《全职高手》入选“数字文化十大IP”
- 李斌立flag:明年销量翻倍,后年盈利
- 阿里整合国内和海外电商,成立电商事业群,蒋凡出任CEO
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。