9月14日消息(赵婷婷)在日前召开的2024服贸会通用人工智能算力论坛上,中国工程院院士、清华大学计算机科学与技术系教授郑纬民发表题为《构建国产智算系统的关键》的主题演讲。
郑纬民表示,当前大模型进入多模态发展,不仅限于文本处理,还包括图像与视频等多媒体形式;并且大模型的应用领域正在不断拓展,涵盖了金融、医疗、汽车以及智能制造等多个行业。
随着AI快速发展,对算力的需求呈现出爆炸式增长。而大模型的开发与部署尤其依赖于强大的算力支持。大模型的研发通常涉及五个关键阶段:数据获取、数据预处理、模型训练、模型微调以及模型推理,每一个阶段都需要大量的计算资源。尤其是在模型训练与推理过程中,算力消耗分别占据了整体需求的大约70%与95%。
目前,用于训练的设备主要包括英伟达的GPU。尽管英伟达的GPU以其出色的硬件性能及成熟的编程生态体系受到广泛欢迎,但由于国际供应受限,导致价格高涨且供不应求。在此背景下,算力的国产化势在必行。目前国内相关企业已开始自主研发AI芯片,并取得显著进展,多家公司如华为、曙光、寒武纪及摩尔线程等均已有产品问世。然而,尽管国产化取得了积极成果,但在实际应用中仍面临挑战,尤其是软件生态系统的建设尚需加强。
郑纬民指出,为了改善这一状况,清华大学开发了一套名为“八卦炉”的核心基础软件,包括并行系统、编程框架、AI编译器、算子库等十个软件,旨在优化国产智算系统的软件环境。该软件已在多个平台进行测试,并成功应用于大模型训练任务,如LLAMA、百川和悟道等,不仅能够正确完成训练任务,而且在成本效益方面表现出色,仅英伟达GPU的六分之一。
此外,“八卦炉”还在其他应用场景中展现出了卓越的性能提升能力,例如,在沐曦、燧原、摩尔线程等企业的实践中,提升了算力效率,并降低成本。
演讲最后,郑纬民总结道,“发展人工智能,构建国产智能算力至关重要。智能算力的软件生态是当前制约我国人工智能发展的关键因素,优秀的系统软件能够充分释放底层硬件算力的潜力。”
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。