AI时代的底座变迁：昇腾大EP+一体机筑基千行万业智能化升级

5月24日专稿（蒋均牧）燧石取火让原始人挣脱黑暗桎梏，蒸汽轰鸣为工业革命注入澎湃动能，硅基芯片的诞生催生了信息时代的高度繁荣……一个个“底座”，构成了人类文明进步的长梯。现如今，人工智能（AI）的浪潮席卷全球，各种AI应用如雨后春笋般涌现，日益成为生产力、创造力的代名词。如何筑牢托举起算力这一新时代“火种”的底座，使之如源头活水般精准灌溉千行万业，已然成为一个汇聚各方视线的核心议题。

2025年世界电信和信息社会日智算产业创新发展专题研讨会上，华为昇腾计算业务副总裁王庆文以“共筑坚实智算底座，加速行业智能化”为题，勾勒出一幅算力筑基、产业共荣的蓝图。基于对AI产业趋势、运营商算力基础设施建设与行业智能化发展路径的深度解读，他给出了昇腾的答案：大规模专家并行（大EP）集群推理方案。

通过将混合专家（MoE）模型的专家权重分散到更多计算卡上，变“单机独奏”为“集群交响”，在硬件性能受限的现实中，昇腾用系统级优化开辟新局面——不仅吹响了众多行业效率革命的号角，提供了运营商深度参与AI盛世的利器，更为国人握紧AI产业发展的“方向盘”创造了条件。

AI2B奇点已至，运营商具天然优势

“如果说训练是上学，推理就是上班。”王庆文用一句生动的比喻，道破了AI产业从技术探索到商业落地的跃迁。Gartner数据显示，2025年全球80%的中国企业将部署生成式AI，60%会将AI融入核心生产系统，标志着企业AI应用从通用场景向核心生产场景渗透的“奇点时刻”到来。

这一转变的背后，是AI推理从“可用”到“好用”的质变。首先，AI在深度搜索、思维链、多模态融合等技术方面已经取得了明显的突破。大语言模型从原来的黑箱式的问答走向可解释的因果推理，在多个逐步达到了媲美领域专家的水平。例如某三甲医院的AI医疗诊断系统将单张病理切片分析时间从40分钟压缩至秒级，效率提升超百倍；某日化巨头的AI质检系统将故障率从2.3%降至0.05%，年省成本超300万元；上海300所中小学的教师利用AI来备课，将备课时间缩短82%，教案生成效率提升300%。

其次，AI模型生态已从千模百态演变为“十强并立”，国内更是“五岳争锋”，高质量模型脱颖而出。这种收敛并非垄断，而是产业成熟的标志，促使“高手”们良性竞争、市场健康发展。根据斯坦福大学《2025年人工智能指数报告》，排名第一和第十的模型的差距已从12%锐减至5%。

最后，MoE模型快速成熟，推动AI产业走向商业爆发。《2025年人工智能指数报告》显示，达到GPT-3.5水平的模型推理成本在两年间下降9~900倍，小模型成本也在18个月内下降280倍；DeepSeek的成本利润率则达到惊人的545%。更深层次的影响在于安全与自主，当美国试图以算力枷锁遏制中国AI产业发展，MoE架构的出现不啻为一场“平权运动”。

王庆文指出，运营商在提供推理服务上具有天然优势：凭借领先的泛在多级训推资源，以及全国性网络基础设施和数据中心机房，既能满足中小企业的灵活需求，也能支撑大型企业核心业务及海量用户场景。同时，通过多租户部署技术，保障大租户资源独立、中小租户性能提升的同时全方位确保数据安全。此外，得益于长期向市场提供优质的信息通信服务，运营商积累了广泛的公众/政企客户，树立了良好的口碑。

昇腾大EP：革命性创新筑基AI未来发展

IDC数据显示，2024年AI IT总投资规模达3158亿美元，到2028年有望增至8159亿美元，五年复合增长率32.9%。AI应用的规模化落地也在倒逼基础设施升级。

一方面，正如蒸汽机的普及反而推动煤炭消费激增，AI技术进步降低了单次应用的算力消耗，却激发出指数级增长的总需求。另一方面，在模型架构层面，“小专家”模式的兴起带来了专家数量的增加，从DeepSeek V2的160个专家到V3的256个专家，如何在保证负载均衡的同时降低通信开销，成为新的挑战。

昇腾从基础硬件、算子到推理系统全面创新，面向不同的推理场景需求，为包含运营商在内的客户及伙伴提供集高性能、高可靠、易部署、开源开放于一体的推理解决方案。其面向大型企业、C端超级应用等场景推出的大规模专家并行集群推理方案，正是针对上述症结的“组合拳”。

其核心逻辑在于“分而治之”——将原本集中于单卡的专家权重分散到多卡，通过动态负载均衡与通信优化，实现“1+1>2”的系统效能。这种设计理念，恰如现代医院从 “全科大夫” 转向 “专科细分”，当眼科、外科、内科专家各司其职，整体接诊效率自然得以极大提升。数据显示，采用大EP方案后平均单卡吞吐性能提升3倍以上，大幅降低每Token推理成本，帮助运营商构筑高性能的AI算力基础设施，为行业客户带来更优的业务体验。

在这背后有几大革命性创新：分布式部署，单卡专家数从16~32个降至4~5个，内存容量占用减少60%，支持更大KV缓存以承载高并发；动态均衡，通过多层次均衡策略、全局智能调度，实时感知专家负载，自动迁移热点任务，避免“旱涝不均”；通信优化，采用RoCEv2网络协议、PA+MLAPO融合算子、双流并行等手段，大幅降低All-to-All通信时延，让“专家会诊”效率倍增。

今年以来，科大讯飞携手昇腾率先实现了MoE模型的大EP集群推理，双方在算子融合、混合并行策略和通信计算并行等方面深度协同创新，推理集群中单卡静态内存占用仅为双机部署的1/4，推理吞吐性能提升3.2倍，端到端时延降低50%。工商银行采用昇腾大EP方案在同业率先完成DeepSeek开源大模型的私有化部署，无缝接入行内“工银智涌”大模型体系，并在后续的1个月时间内实现行内50余个场景的模型升级，为业务高质量发展注入强劲动力。移动云成功部署基于昇腾AI算力底座的大EP推理集群，在移动云MaaS平台、COCA推理系统上线，突破性实现单卡吞吐提升3倍，解码时延降低50%，推动AI技术革新。

大模型应用一体机：大开智能化方便之门

有统计显示，我国中小微企业数量已突破6000万户，每天有超万户新企业破土而出，它们贡献了60%以上的税收、60%以上的GDP，创造了70%以上的技术创新成果，吸纳了80%的城镇就业。然而，当AI浪潮拍岸，他们却因为成本、技术、人才、运维等方方面面的问题而在智能化升级上举步维艰。

昇腾面向中小微企业以及学校、医院等机构需要快速部署、快速落地AI应用的需求，使能运营商打造大模型应用一体机，大开方便之门。

该方案巧妙打包量化、调优等工具链，将部署效率大幅提升50%；借助MLA（Multi-Head Latent Attention）亲和等卓越特性，吞吐性能更是飙升90%；支持vLLM，将推理应用业务上线周期缩短至天级，真正实现了从模型部署到应用上线的“即开即用”。这大大降低了AI部署的门槛，让智能化不再是大型企业的专属，而是惠及每一家企业、每一个组织。

目前，已有超140家合作伙伴基于昇腾发布大模型应用一体机产品，应用场景广泛覆盖医疗、教育、金融、制造等多个领域。

写在最后：昇腾为舟，驶向星辰大海

站在2025年的门槛回望，AI发展轨迹清晰可辨：从ChatGPT的现象级破圈到DeepSeek的全民普及，再到昇腾大EP集群的工程化突破，AI正由锦上添花的“技术盆景”蜕变真正驱动经济增长的“水电煤”。“共筑坚实智算底座，加速行业智能化”的演讲主题，或许是对昇腾使命的最佳注解。

“单木不成林，众木自成春”。在生态方面，昇腾围绕“硬件、算子、加速库、模型、应用”五大方向，已联合伙伴开发了160多个高性能算子、孵化40多个大模型和380多个应用，全流程使能大模型从创新到落地。在行业应用上，昇腾已经联合2500多家应用伙伴、共同孵化了5800多个行业解决方案，加速了大模型在各行各业的规模应用。

当技术创新与生态协同形成共振，AI产业的未来必将如星河般璀璨。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。

AI时代的底座变迁：昇腾大EP+一体机筑基千行万业智能化升级

下一篇