星火语音大模型发布,将推动人机交互革命

“大模型带来了语音技术发展的全新机会。”

1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并正式发布星火语音大模型,推动万物互联时代下人机交互场景变革。

“科大讯飞从创业之初的梦想和使命,就是要实现沟通无障碍。25年了,我们目标和梦想一天都没有变。”科大讯飞董事长刘庆峰在发布会现场如是说。星火语音大模型所展现出的卓越性能,验证了科大讯飞在人工智能自然语音领域的深厚积累,也彰显了其在推动人机交互技术进步方面的能力与决心。

三大维度能力升级,星火语音大模型效果国际领先

科大讯飞的智能语音技术持续走在世界前列,2023年以来,在DCASE工业声纹挑战赛、IWSLT国际机器口语翻译大赛、CHiME高噪音复杂多通道多人说话场景比赛、国际车载多通道语音识别挑战赛等涉及工业、高噪、车载等复杂场景的比赛中接连收获冠军。

与此同时,全球对语音大模型的研究开始快速升温,出现了新的颠覆性技术逻辑。基于海量的数据训练,大模型可以实现更精细的模型描述、更精准的语义理解以及更统一的多任务建模,这给语音技术的发展带来了全新机会。凭借星火认知大模型的持续升级,以及科大讯飞在语音属性解耦表征预训练等方面的深厚积累,基于“飞星一号”的国产算力平台,科大讯飞在几个月内迅速推出了讯飞星火语音大模型。

目前,星火语音大模型在语音合成层面提升了韵律表现力和拟人度,在语音识别领域突破复杂场景识别效果上限,在多语种层面提升语料稀缺小语种效果。“通过星火语音大模型的评测效果,我们非常自豪地告诉大家,科大讯飞继续保持了全球领先的水平。”刘庆峰介绍,星火语音大模型效果国际领先,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3,在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。

四大功能特性,重塑人机交互体验

在星火语音大模型的加持下,智能客服实现进一步升级,具备超拟人语音合成、情绪感知、复杂语义理解、业务逻辑推理四大功能特性,将重塑人机交互体验。

超拟人合成技术可以通过更精细的模型描述,提升智能客服的韵律表现力和拟人度,生成更像人、更生动的语音表达,实现近乎完美的人机交互体验,为客服机器人的应用开辟了新的可能。

情绪感知能力使智能客服能够更好地理解和回应用户的情感状态。通过分析用户的语音语调、语速和表达方式等特征,智能客服可以判断用户的情绪是积极的、消极的还是中性的,调整自己的回答方式,以提供更加贴心的服务。

复杂语义理解能力让智能客服可以在较长的对话中,理解上下文的变化,对用户的需求提供更准确的反馈,并能通过提问的方式引导用户提供更多信息,从而解决复杂问题,提高用户满意度。语音打断功能允许用户随时中断智能客服的发言,这种灵活性使得用户能够更好地控制对话的进程,实现更加高效的交互。

业务逻辑推理能力使智能客服在接入客户问询时,能够理解用户意向及偏好,识别销售机会,引导相关产品或服务,以提供更为精准和个性化的体验,这一能力对于增强用户体验和提升服务效率具有显著意义,也可帮助企业在服务过程中实现潜在的业务转化。

“百”搭型选手,赋能实际行业应用

客服是人机交互的典型场景之一,也是各行各业的刚需场景。作为“百搭”型产品,星火智能客服在行业中的应用已经非常广泛。

以金融客户服务为例,当用户来电咨询关于理财产品或信用卡额度等相关问题时,智能客服能够迅速识别用户的多样化需求,并将这些需求与相应的业务模块相匹配,提供准确的解答。同时,在回答问题的过程中,智能客服还会运用专业的引导话术,如在收到用户咨询信用卡额度相关问题时,关联信用卡提额相关活动,引导用户完成业务办理,从而在一轮通话内完成从闲聊咨询到业务营销到业务办理的全过程。

星火语音大模型的应用远不止于客服领域,其广泛的适用性使其能够在各行各业发挥重要作用。例如,在汽车行业,星火语音大模型的集成将极大提升智能驾驶舱、智能座舱、智能导航系统以及音乐控制系统的交互体验,使之更加精准、高效。此外,陪伴机器人、导购机器人、辅助诊断机器人、智能家居设备以及穿戴式技术产品等领域,也将因星火语音大模型的加持而迎来新的发展机遇,进一步激发产业活力。

双重价值提升:用户体验与企业效率

技术价值的核心在于应用,而应用的成效需要看实际落地效果。目前,星火智能客服产品已经在科大讯飞内部上线使用,其应用价值不仅体现在提升用户体验,更在于帮助企业降本增效。

首先,星火智能客服较之传统智能客服,在复杂说法理解、拟人化交互层面具有较大优势,加之目前知识管理已实现文档级运营,能够实现24小时不间断的客户服务,端到端解决用户问题,提升用户体验。科大讯飞400客服中心,率先使用大模型文字客服,机器人自助服务率环比提升142%, 通过大模型赋能坐席,话后处理时长环比降低30%。

此外,星火智能客服能够自动学习知识库中的知识,处理大量重复性和常规性的咨询,话后可以自动生成工单小结,将坐席人员从繁重冗余的工作中解放出来,从事更为复杂和创造性的工作。这样的智能化分工,有助于降低企业的人力成本,同时提高整体的工作效率。再深一层,星火智能客服还能够从海量通话中提取共性需求,帮助企业更好地理解用户,优化产品和服务,在激烈的市场竞争中获得优势。

在智能语音领域,科大讯飞始终保持着行业领跑者的姿态。“如今,通过大模型的应用,科大讯飞能够赋予语音更多维度的特性,包括语种识别、内容理解、韵律把握、音色变化以及情绪表达等。”可以预见,2024年,由讯飞星火所引领的新一代人机交互模式,将全面开启未来交互新纪元。

*文中数据来源于实际应用

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )