中国AI低调两连发引热议,阿里千问与DeepSeek携手上架魔搭社区

极客网·人工智能 3月26日,中国AI又给全球开源社区带来了新惊喜——阿里通义千问与DeepSeek,均于昨日低调开源了两款新模型:阿里发布了更适合本地部署的高性能「多模态模型」Qwen2.5-VL-32B,DeepSeek则将此前热门的「基座模型」V3更新到0324版本,并官宣在魔搭社区上架开源。截至目前,魔搭社区模型总数已超4万个,已成为中国最大的AI开源社区。

 1.jpg

千问Qwen-VL是全球AI开源社区最受欢迎的多模态模型之一,此前,通义千问Qwen2.5-VL已开源3B、7B及72B等3个尺寸,昨日又推出更适合本地部署的32B版本。Qwen2.5-VL-32B模型在MMMU、MathVista、 MM-MT-Bench 等基准测试中的性能表现突出,超越了更大规模的 Qwen2-VL-72B 和 GPT-4o-0513,并且优于近期火热的 Mistral-Small-3.1-24B 、Gemma-3-27B-IT等模型。在开发者关注的知名Hacker News网站上,Qwen2.5-VL-32B的热度爆表,是当天评论最多的新闻。

 2.jpg

 3.jpg

DeepSeek-V3是全球最受关注的基座大模型之一,也于昨夜官宣完成小版本升级。据DeepSeek透露,新版 V3-0324 模型借鉴 R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩,并在前端开发、中文写作、中文搜索等能力上均有提升。V3-0324 模型在HuggingFace开源后不久,即斩获趋势榜榜首。同时,在昨日官方推文中,DeepSeek首次官宣在魔搭社区开源,更好服务于中国开发者和企业。

 4.jpg

据了解,阿里云联合CCF开源发展委员会共同牵头组建的魔搭社区(Model Scope),已发展成为中国最大的AI开源社区。秉承“模型即服务”(MaaS,Model as a Service)理念,魔搭为AI开发者提供模型体验、下载、调优、训练、推理、部署等一站式服务,“找大模型上魔搭”成为开发者心照不宣的默契。截至目前,阿里通义千问、DeepSeek、阶跃星辰、MiniMax、月之暗面、百川智能、零一万物、智谱AI等知名大模型公司均官方在魔搭开源最新模型,魔搭社区模型总量超过 4万个,涵盖LLM、对话、语音、文生图、图生视频、AI作曲等多个领域,魔搭已经服务超过1000万开发者。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2025-03-26
中国AI低调两连发引热议,阿里千问与DeepSeek携手上架魔搭社区
3月26日,中国AI又给全球开源社区带来了新惊喜——阿里通义千问与DeepSeek,均于昨日低调开源了两款新模型:阿里发布了更适合本地部署的高性能「多模态模型」Qwen2.5-VL-32B,DeepSeek则将此前热门的「基座模型」V3更新到0324版本,并官宣在魔搭社区上架开源。

长按扫码 阅读全文