开源,升级,降价:通义大模型“杀疯了”

9月19日消息(九九)9月19-21日,2024云栖大会在杭州云栖小镇举行。在今天下午的主论坛上,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,同时宣布通义旗舰模型Qwen-Max、通义灵码和通义万相全面升级,并发布全新视频生成模型。

另外值得一提的是,阿里云百炼平台上的三款通义千问主力模型再次降价:Qwen-Turbo价格直降85%,低至百万tokens 0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。

通义千问新一代开源模型Qwen2.5性能超越Llama

新一代开源模型Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。

周靖人介绍,Qwen2.5全系列模型都在18T tokens数据上进行预训练,相比Qwen2整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力。在语言模型方面,Qwen2.5开源了7个尺寸:0.5B、1.5B、3B、7B、14B、32B、72B,它们在同等参数赛道都创造了业界最佳成绩,型号设定充分考虑下游场景的不同需求。其中,3B是适配手机等端侧设备的黄金尺寸;32B是最受开发者期待的“性价比之王”,可在性能和功耗之间获得最佳平衡;旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座

自从2023年8月开源以来,通义在全球开源大模型领域后来居上,成为开发者尤其是中国开发者的首选模型。性能上,通义大模型日拱一卒,逐步赶超美国最强开源模型Llama,多次登顶Hugging Face全球大模型榜单;生态上,通义从零起步、开疆拓土,与海内外的开源社区、生态伙伴、开发者共建生态网络,截至2024年9月中旬,通义千问开源模型下载量突破4000万,Qwen系列衍生模型总数超过5万个,成为仅次于Llama的世界级模型群。

旗舰模型Qwen-Max性能接近GPT-4o

2024云栖大会上,周靖人宣布通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。

相比上一代模型,Qwen-Max在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多个权威基准上,Qwen-Max表现接近GPT-4o,数学能力、代码能力则超越了GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。

相比2023年4月的初代通义千问大模型,Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了700%以上。

通义万相视频生成模型一键创作影视级高清视频

与Qwen-Max一同进行升级的还有通义万相,并首批上线文生视频、图生视频功能,在文生视频功能中,用户输入任意文字提示词,即可生成一段高清视频,支持中英文多语言输入,并可以通过灵感扩写功能智能丰富视频内容表现力,支持16:9、9:16等多种比例生成;在图生视频功能中,支持用户将任意图片转化为动态视频,按照上传的图像比例或预设比例进行生成,同时可以通过提示词来控制视频运动。

通义万相视频生成大模型集成了多项创新技术,有效解决画面表现力和大幅度运动等视频生成技术难题。针对运动生成和物理模拟等难点优化算法,实现了大幅度主体运动和运镜控制,并有效模拟真实世界物理特性;设计了高压缩比、高质量视频VAE框架,有效降低视频信息冗余,并保持高质量视频重构能力;同时,基于轻量微调框架和精选数据集优化训练,在中式传统元素、风格化视频生成上表现更好。

去年7月,通义万相图像生成大模型首次亮相,目前已累计生成7500万张图片。2024云栖大会现场,通义万相宣布视觉生成大模型全面升级为Diffusion Transformer框架,同时结合通义千问复杂提示词解释能力,有效提升画面表现力、语义理解能力、可控生成能力。随着通义万相视频生成模型的发布,通义大模型已覆盖文本生成、图像理解、视频理解、音频理解、图像生成、视频生成等全模态场景。

除此之外,通义灵码AI编程能力也再次进化,从一年前只能完成基础的辅助编程任务,进化到几句话就能完成需求理解、任务拆解、代码编写、修改BUG、测试等开发任务,最快几分钟可从0到1完成应用开发,提升数十倍开发效率。

通义千问三款主力模型再降价,最高降幅85%

继5月首次大幅降价后,2024运气大会上,阿里云百炼平台上的三款通义千问主力模型再次官宣降价。Qwen-Turbo价格直降85%,低至百万tokens 0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。其中,Qwen-Plus推理能力追平GPT4,可应用于复杂任务,是效果、速度及成本均衡的最优选择,降价后,Qwen-Plus性价比达到业界最高,同等规模较行业价格低84%。同时,阿里云百炼平台还为所有新用户免费赠送超5000万tokens及4500张图片生成额度。

周靖人介绍,自首次宣布降价后,阿里云百炼付费客户数较上一个季度增长超过200%,大批企业和开发者放弃私有化部署,选择直接在百炼上调用各类AI大模型。目前,阿里云百炼已服务超30万客户,包括一汽、金山、猎聘、哈啰集团、国家天文台等众多知名企业和机构。“本次通义第二轮降价,将继续提升AI在各行各业的渗透率。”周靖人说。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2024-09-19
开源,升级,降价:通义大模型“杀疯了”
开源,升级,降价:通义大模型“杀疯了”,C114讯 9月19日消息(九九)9月19-21日,2024云栖大会在杭州云栖小镇举行。在今天下午的

长按扫码 阅读全文