2月14日消息(颜翊)国际数据公司(IDC)与浪潮信息联合发布《2025年中国人工智能计算力发展评估报告》(简称《报告》)。《报告》指出,大模型和生成式人工智能推高算力需求,中国智能算力增速高于预期。2025年中国智能算力规模将达到1,037.3 EFLOPS,预计到2028年将达到2,781.9 EFLOPS。
中国企业将人工智能作为产业创新的抓手,加速探究生成式人工智能等先进技术在行业中的应用,越来越多的中国企业正在积极制定和实践人工智能转型战略。IDC调研显示,42%的中国企业已经开始进行大模型的初步测试和重点概念验证,17%的企业已经将技术引入生产阶段,并应用于实际业务中。
对大型模型及生成式人工智能需求的日益增长,正显著推动中国人工智能算力基础设施的快速发展,促使企业不断升级其硬件配置,通过采购高性能的计算设备、优化数据中心基础设施、提升存储和网络能力等,进一步支持复杂的人工智能运算任务。IDC调研结果显示,在未来18个月内,中国企业在生成式人工智能项目上的投资将首要集中在硬件升级方面。
IDC研究发现,随着生成式人工智能和大模型逐步扩大应用,企业将面临来自数据、算力、模型、人才、成本等多方面的挑战。其中,算力基础设施是关键议题,企业当下面临的相关挑战包括但不限于计算架构难以支持大规模应用、与基础设施建设和维护相关的高昂成本投入,以及高性能的计算资源的不足。
企业在人工智能大模型训练、推理阶段,会面临不同的算力挑战。对于持续开展大模型训练和研发的企业和研究机构而言,他们需要完成大量计算任务,推高算力需求,将长期处于高性能算力供不应求的状态;随着大模型和生成式人工智能技术在实际应用场景中落地,企业普遍面临以推理负载为主的算力需求,在推理阶段,算力分配和调度是主要问题,推理任务的算力需求具有波动性,难以预测和管理,导致资源分配不均衡,缺乏有效的算力分配和调度机制,导致算力资源的局部浪费和整体利用率低下,这不仅影响了人工智能基础设施的算力效率,也增加了整体成本。
此外,对于调整技术发展路径的科技企业或者行业巨头而言,如放弃自研大模型转用第三方模型,结束大模型训练转向模型推理,或通过模型剪枝、量化等方法降低模型算力需求,可能会出现算力盈余的情况。同时,在智算中心的积极建设的过程中,部分中心也出现了在实际运营中算力利用率未达预期的情况。
在人工智能单点技术应用方面,IDC调研显示,图像技术成为当下最主要的应用技术类型,人脸与人体识别紧随其后, 自然语言处理位列第三。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。