大模型落地持续加速中。
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,效果在多个基准测试上对标GPT-4o,且第三方测评居国内第一。
目前,混元Turbo已经在腾讯云上线,输入和输出价格只有前代模型的一半。企业和开发者可以通过API、专属模型、精调模型等方式使用混元大模型相关能力。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,随着大模型与生成式AI的技术突破,图片、视频、语言的理解与生成已经有很大进步,人与人的沟通、人与系统的交互方式,都可能会被重塑。最近半年,产业界对AI大模型的关注重点,开始从模型技术本身,转到智能应用落地上。用人工智能在已有业务场景中降本增效,提高经营效率,是行稳致远的可靠路径。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生
据介绍,腾讯已经构建起了全链路的大模型产品矩阵,包括底层基础设施、帮助企业训练专属模型的TI平台和行业大模型解决方案,自研的混元大模型,构建应用的平台工具,以及基于大模型的各类智能应用。
会上,腾讯AI应用“元宝”宣布品牌智能体专区正式上线,企业在腾讯元器上制作的智能体可以一键发布到品牌智能体专区。品牌智能体专区首批邀请 11 家合作伙伴入驻,打造精品AI智能体应用生态,涵盖工作提效和生活娱乐多个场景,用户可以直接在“腾讯元宝”APP上体验丰富的品牌智能体应用。
“面向场景创造价值才是大模型发展的意义。”腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声表示,大模型已经在全球发展了两年,一方面,模型性能不断提升,围绕着模型的产品使用门槛变得更低、更加易用;另一方面,企业积极探索大模型与自身业务场景的结合,大模型的落地场景变得更丰富、更纵深。
腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声
吴运声介绍,基于全矩阵的大模型产品,腾讯已经服务了众多客户,在知识管理、智能客服、研发提效、智能营销、内容生成、办公协同、风险管控等场景中,帮助企业实现了降本增效和业务创新。
大模型工具持续升级,更便捷、更易用
为了让企业更快更便捷地开发AI原生应用,腾讯云在今年5月推出了三款PaaS产品知识引擎、图像创作引擎和视频创作引擎,加速应用落地。
通过大模型知识引擎,企业用自然语言和简单配置,5分钟就可以开发出一款大语言模型应用,服务于客服营销、企业知识社区等业务场景。经过几个月的产品迭代,知识引擎产品在用户需求识别与理解、企业知识处理、检索和理解能力上,都有很大升级。同时,知识引擎支持组件能力单独输出,企业可以按需购买文档解析、文档拆分、向量化等能力,按需部署到自身的应用中去。
在图像创作引擎层面,基于混元生图能力的升级,图像风格化、AI写真、商品背景生成、模特换装等功能也进一步实现了迭代。在AI写真层面,图像创作引擎实现了免训练技术突破,输入一张照片后可直接跳过训练环节等待,一键生成高清写真艺术照,整体出图耗时缩短75%。
针对很多电商商家高频使用的商品背景生成能力,图像创作引擎可实现商品在不同场景中高度逼真的虚拟效果展示。在模特换装场景下,采用3D先验方案,提升重建人像效果,在高度保持模特脸部、手部细节的同时,精确将服装版型细节与模特身体特征对齐,确保换装后的效果逼真自然。
基于混元的DiT架构模型,视频创作引擎也迎来了全新的升级。新增了图片跳舞、图片唱演和视频转译等能力,已经实现了单段舞蹈的生成时间从10分钟下降至1分钟级别,同时支持转身、侧身等难度舞蹈动作。同时,针对很多客户有需求的视频转译能力,视频引擎接入了混元文生文大模型和 TTS 技术,让转译后的视频能够保留说话人的音色特征,同时实现说话人口型与目标语种一致的视听效果。目前视频转译功能支持超过15种小语种,覆盖主流外语翻译,可应用于视频本地化、跨境电商等场景。
为了帮助企业用户更便捷地打造专属模型,人工智能开发平台TI平台也进行了全新升级。
TI平台致力于构建面向实战的大模型精调工具链,帮助用户训练出真正可用的大模型,并缩短模型开发周期,提升研发效率与资源利用率。
高质量的训练数据是精调出一个可落地大模型的前提条件。TI 平台的多模态数据集管理和数据标注能力,可提升大模型精调的数据准备效率和训练数据质量,从而提升大模型训练效率和最终效果。
在精调数据准备层面,TI平台全新支持面向多模态大模型的数据集管理和数据标注,首创了基于Schema的标注方法,支持用户自动生成个性化标注工作台,支持文生文、图生文、图文改写、图文混合问答等主流场景下的全部细分任务类型。
落地加速,场景创新更丰富、更纵深
大模型要贴近场景创造价值已经是业界的共识。腾讯目前已经有700多款产品接入混元大模型,实现用户体验的提升。腾讯全矩阵的大模型产品目前已经在知识管理、智能客服、研发提效、智能营销、内容生成、办公协同、风险管控等落地。
在智能客服与知识管理场景中,基于大模型的生成能力,可以显著提升复杂问题的解决效率,提升回答质量。长安汽车与腾讯利用大模型知识引擎,整合汽车使用手册等资料,有效解决了客户在车辆使用和维护中的疑问,显著提升了客户服务体验。
在智能营销场景,大模型可以提升广告素材的生产效率,增强营销活动的趣味性和互动性。比如蒙牛集团利用图生图技术,将用户上传的全家福转化生成为特制的卡通画风,助力会员拉新、提升用户活跃。
在内容创意场景,大模型可以让内容生产的周期大幅缩短,提供更多的创意玩法。比如,人民日报、新华社等媒体结合混元的文生视频能力进行视频创作。过去,视频内容需要一帧帧进行设计和制作,制作周期短则数天,长则数月。现在借助视频生成能力,只需一段文字或者几张图片,就能在几分钟内生成优质视频内容。
在研发提效领域,腾讯利用TI平台等工具,帮助易车、阅文等企业搭建自己的大模型,显著降低了模型构建的时间和成本;另一方面,通过腾讯云AI代码助手等工具,辅助开发者提升研发的效率,帮助企业提升整体研发效能。
在办公协同场景中,腾讯旗下的企业微信、腾讯会议、腾讯文档都已经接入了混元大模型。在大模型的助力下,企业微信可对英文邮件进行智能检查,辅助英文邮件纠错,腾讯会议可以自动总结会议纪要,腾讯文档能够自动生成各类文档。
在风险管控领域,风控大模型可以解决传统风控中建模时间长、效率低的难题。通过打包丰富的反欺诈知识,实现“小样本”训练迁移,快速构建契合业务需求的风控模型体系。比如,东风日产汽车金融,基于少量提示样本迁移,就完成了适配自身业务场景的风控模型定制。相比于传统的建模方式,模型KS性能提升超过20%,在跨场景的泛化性测试上性能提升53%。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )