人工智能大模型风起云涌 寒武纪彰显科技创新硬实力

2023年堪称人工智能大模型大爆发的一年,用百花齐放来形容也不为过。在这一年里,人工智能发展迅猛,速度超过以往任何历史时期。众多高质量大模型纷纷亮相,涵盖多个行业领域,应用场景也在不断拓展。

寒武纪拥有领先的芯片设计能力,能提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。面对大模型为人工智能带来的新机遇,寒武纪主动出击,积极把握。

2023年,寒武纪持续进行大模型的优化和适配工作,先后开发了BangTransformer大模型分布式推理加速引擎,CNDeepspeed/Megatron-LM大模型分布式训练加速引擎,大模型推理与训练性能预估工具、分析工具以及精度分析工具等大模型相关软件栈,同时基于思元370等系列产品,与LLaMa系列、BLOOM系列、GLM系列、Stable Diffusion、T5,以及国内的百川、千象等大模型进行了广泛的适配和验证,性能优异,并可支持自然语言处理、视觉、多模态等多种场景的大模型应用。

2024年上半年,凭借人工智能芯片产品的核心优势,寒武纪持续深化与互联网、大模型等前沿领域头部企业的技术合作,以卓越的产品适配能力和开放合作的务实态度,积极助力人工智能的实际应用落地,获得了客户的认可。

在这一时期,寒武纪新一代智能处理器微架构和指令集正在研发中。新一代智能处理器微架构及指令集将对自然语言处理大模型、视频图像生成大模型以及推荐系统大模型的训练推理等场景进行重点优化,将在编程灵活性、易用性、性能、功耗、面积等方面提升产品竞争力。同时,寒武纪对基础软件系统平台也进行了优化和迭代。训练软件平台方面,寒武纪大力推进了大模型业务的适配和优化。推理软件平台方面,寒武纪在AIGC业务适配、开源生态建设及易用性等方面都取得了一定进展。

长期以来,寒武纪秉承开放、合作、共享的理念,积极参与开源社区的建设,在多个重要开源项目中贡献代码,如PyTorch、TensorFlow、Huggingface、Transformers、vLLM、Deepspeed等大模型训练推理应用中的核心组件。

人工智能正在深刻地改变着人类的生产生活,寒武纪站在时代的风口浪尖,将继续秉承持续创新、攻坚克难的精神,携手员工及合作伙伴,不断提升产品竞争力及营收业绩,同时为行业和社会的繁荣发展贡献力量。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )