华为携手科大讯飞:国产算力突破瓶颈,专家并行集群推理引领未来智能浪潮

华为携手科大讯飞:国产算力突破瓶颈,专家并行集群推理引领未来智能浪潮

随着科技的飞速发展,人工智能(AI)已成为推动全球产业变革的重要驱动力。华为与科大讯飞研究院的联合突破,无疑在国产算力领域树立了一座新的里程碑。这一联合团队在MoE模型的大规模跨节点专家并行集群推理方面取得了重大进展,为未来智能浪潮引领了新的方向。

首先,联合团队通过软硬件的深度协同创新,挖掘了硬件的潜力。在算子融合方面,他们通过异构计算单元并行流水,将多个小算子融合重构为原子级计算单元,消除了小算子下发的开销。这一创新性的举措,使得在昇腾集群上的验证和部署得以完成,并实现了性能的显著提升。

在混合并行策略和通信计算并行优化方面,团队构建了TP(张量并行)+EP(专家并行)混合范式。他们创新地采用机内TP并行,发挥机内高速互联优势,降低跨机通信损耗;同时,他们还创新MoE专家分层调度,64卡均衡分配专家计算节点,定制AllToAll通信协议,专家数据交换效率提升40%。这一创新性的分层优化策略,进一步降低了跨机和机内流量,提升了整体集群的吞吐能力。

此外,团队还研发了路由专家负载均衡算法,实现了卡间负载差异小于10%,进一步提升了集群的整体性能。分布式架构的创新与算法协同优化,使得他们在国产算力上实现了显著的性能提升。单卡静态内存占用缩减至双机部署的1/4,效率提升75%,专家计算密度增加4倍,推理吞吐提升3.2倍,端到端时延降低50%。这些显著成果的实现,无疑为国产算力的发展开辟了新的道路。

值得一提的是,科大讯飞深度推理大模型星火X1也完成了升级。在模型参数量比业界同行少一个数量级的情况下,星火X1的数学能力全面对标DeepSeek R1和OpenAI o1,在中文数学各项任务中“均实现领先”。这无疑证明了星火X1在深度推理模型方面的强大实力。

华为与科大讯飞的联合突破,不仅在技术层面取得了重大进展,更是在未来智能浪潮中引领了新的方向。专家并行集群推理的应用前景广阔,预期训练时推理效率将提升200%。基于该方案的推理引擎也实现了DeepSeek V3和R1的高效推理,无疑将为人工智能的发展注入新的活力。

总的来说,华为与科大讯飞的联合突破,打破了国产算力的瓶颈,引领了专家并行集群推理的新潮流。这一创新的解决方案也将应用于讯飞星火深度推理模型的训练加速,无疑将为未来的智能浪潮注入新的动力。未来,我们有理由期待更多的科技创新和突破,推动人工智能的进一步发展。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2025-03-11
华为携手科大讯飞:国产算力突破瓶颈,专家并行集群推理引领未来智能浪潮
华为与科大讯飞联合突破国产算力瓶颈,通过专家并行集群推理引领未来智能浪潮,预期训练时推理效率提升200%。

长按扫码 阅读全文