Meta推出无缝沟通AI翻译模型

12月4日消息(郭睿琦)今年 8 月,Meta 公司推出了其多模态人工智能翻译模型 SeamlessM4T,该模型支持近 100 种语言的文本和 36 种语言的语音。现在该模型更新了“v2”架构,Meta 将其称之为“Seamless Communication(无缝沟通)”模型,能够让对话翻译更加自然和富有表现力。

两个新功能中的第一个是“SeamlessExpressive”,顾名思义,该功能可以将你的语气转移到翻译后的语音中,包括音调、音量、情感色彩(兴奋、悲伤或低语)、语速和停顿。考虑到目前翻译后的语音一般听起来都很机械,这一突破还是非常值得期待的,无论是在我们的日常生活中还是在内容制作中,都有很大的帮助。目前其支持的语言包括英语、西班牙语、德语、法语、意大利语和中文,不过在IT之家撰写本文时,演示页面缺少意大利语和中文。

第二个功能是“SeamlessStreaming”,可以在说话者仍在讲话时开始翻译,从而让其他人更快地听到翻译。虽然仍有不到两秒钟的短暂延迟,但至少不必等到对方说完一个句子。据 Meta 公司称,最大的挑战在于不同语言有不同的句子结构,因此他们必须开发一个专门的算法来研究部分音频输入,以决定是否有足够的上下文开始生成翻译输出,或者是否继续倾听。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2023-12-04
Meta推出无缝沟通AI翻译模型
带来更自然的跨语言对话体验

长按扫码 阅读全文