小米开源"小米MiMo"大模型:挑战OpenAI o1-mini,7B参数碾压,推理能力瞩目

小米开源"小米MiMo"大模型:挑战OpenAI o1-mini,7B参数碾压,推理能力瞩目

随着人工智能的快速发展,大模型已成为业界研究的热点。小米公司也不甘示弱,其大模型团队通过小米MiMo公众号宣布,他们开源了首个“为推理而生”的大模型MiMo。这款模型在数学推理和代码竞赛公开测评集上展现出了强大的实力,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

MiMo是小米大模型Core团队的一次初步尝试,他们通过联动预训练到后训练的全面提升,使得MiMo的推理能力得到了显著提升。在数据和算法等多层面的创新驱动下,MiMo的推理能力得到了质的飞跃。

预训练阶段的核心是让模型见过更多推理模式,而数据层面则着重挖掘富推理语料,并合成约200B tokens的推理数据。经过三阶段的训练,逐步提升训练难度,总训练达到25T tokens。这些工作为MiMo的后训练阶段打下了坚实的基础。

后训练阶段的核心是高效稳定的强化学习算法和框架。为了解决困难算法问题中的奖励稀疏问题,团队提出了Test Difficulty Driven Reward策略。此外,他们还引入了Easy Data Re-Sampling策略,以稳定RL训练。在框架方面,他们设计了Seamless Rollout系统,使得RL训练加速2.29倍,验证加速1.96倍。这些创新性的方法大大提升了MiMo模型的性能。

开源地址和相关技术报告的链接也已附在文章中。小米MiMo大模型的开源行为展现了小米公司对技术共享和社区合作的重视,这也是小米在人工智能领域积极布局的一部分。

MiMo的推理能力提升不仅体现在参数规模上,更体现在其在实际应用中的表现。在数学推理和代码竞赛公开测评集上,MiMo仅用7B的参数规模,就超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。这一成绩无疑证明了MiMo的强大实力和广阔的应用前景。

小米MiMo大模型的出现,无疑给业界带来了新的思考和启示。它不仅展示了小米在人工智能领域的实力和决心,也为学术界和工业界提供了宝贵的经验和参考。随着小米MiMo大模型的进一步发展,我们期待它在更多领域展现出卓越的性能和价值。

总的来说,小米MiMo大模型以挑战OpenAI o1-mini为目标,凭借7B参数的规模碾压对手,其推理能力令人瞩目。小米MiMo的开源行为和其在技术上的创新性举措,都值得我们肯定和赞赏。我们期待小米MiMo大模型在未来能够取得更多的突破和成就,为人工智能的发展做出更大的贡献。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2025-04-30
小米开源"小米MiMo"大模型:挑战OpenAI o1-mini,7B参数碾压,推理能力瞩目
小米开源"小米MiMo"大模型:挑战OpenAI o1-mini,7B参数碾压,推理能力瞩目 随着人工智能的快速发展,大模型已成为业界研究的热点。小米...

长按扫码 阅读全文