8月24日,以“智算开新局·创新机”为主题的2023浪潮信息新产品“互联网+AIGC”行业巡展暨大模型智算软件栈OGAI发布会在北京重磅开幕。来自百川智能、快手、金山办公、京东云等互联网行业的专家、大咖和生态伙伴汇聚一堂,探讨互联网行业如何把握生成式AI机遇,并分享大模型时代的智算发展之道。
浪潮信息董事长彭震在致辞中表示:“人工智能算力已经成为驱动大模型进化的核心引擎,但是大模型研发经常会面临买不起,建不了,算不好的困境。我们唯有不断创新智算产品技术,结合大模型领域的实践经验,把智算力转化为业务创新力,才能走在AI时代的前列。”
当前,AI计算已经成为大模型产业发展的核心竞争力之一。OpenAI公开数据显示,从GPT-3到GPT-4算力当量增长了68倍,算力依旧是大模型能力提升的核心驱动力。百川智能技术联合创始人陈炜鹏表示:“大语言模型发展规律之一是模型的能力随着计算量扩展,且目前为止我们还没有看到模型的边界。”
要满足大模型对于算力的迫切需求,需要构建强大的智算基础设施。然而智算系统的构建并不是算力的简单堆积,业内普遍意识到大模型训练是如同造火箭一样的复杂系统工程,需要综合考量算力系统的部署、优化、资源调度,数据的采集、清洗、处理,模型训练、推理、迁移、调优以及应用服务、生态构建等一系列问题。
圆桌论坛
解决大模型的算力挑战,已经成为产业创新共同努力的方向。浪潮信息高级副总裁、AI&HPC总经理刘军表示,为了更好的释放大模型的生产力,第一、要让算力系统的效率充分发挥,大模型开发就是在抢时间,效率等于时间和金钱;第二、可扩展性,对于动辄万卡的算力集群系统来说,并行计算策略关乎性能扩展比;第三、要保证训练过程中算力供应的可持续性,充分考虑硬件、软件、算法、框架层面引发的训练中断、失效的问题。我们需要从系统层面整体设计,帮助企业跨越大模型研发门槛。陈炜鹏表示,百川智能正在探索提升大模型训练效率以及研发成功率。快手异构计算负责人刘凌志表示,模型参数量增长超过一定阈值时,智能能力也会表现出跃迁式的提升。面对视频和大模型带来的算力挑战,快手从音视频、AI和数据中心技术入手,深入开发了SL200芯片,实现行业领先的视频压缩效率,并通过StreamLake品牌把基础设施和AI、视频的原子能力赋能产业。
目前,由智算赋能的大模型已经在互联网行业得到了广泛应用,作为大模型应用推进代表企业,金山办公技术总监熊龙飞分享了大模型在办公领域落地的实践:“办公场景AI发展趋势是先满足公网用户需求,再到私有化部署,从单模态变成多模态,从高度依赖大模型原生能力变成更丰富的技术融合,从对话式交互变成更轻度的点击选择交互。”
要推动大模型智算系统的建设,现代化数据中心是关键载体。大模型对于数据中心带来了能耗、算力结构等方面的多重挑战。京东云高级硬件系统架构师王贵林,分享了京东构建大规模数据中心的最新思考:“通过硬件技术创新、软件架构优化以及清洁能源的使用等一系列手段,构建低碳、环保、可持续、智能的全生命周期的数据中心,将成为释放智算力的强大支撑。”
与会嘉宾指出,中国大模型仍处于商业生态发展初期,需要在智算系统构建、平台支撑、算法研发、应用落地等层面进行广泛的生态合作,从而打造更为卓越的大模型,并推动模型的场景化落地,从而真正赋能互联网行业变革。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )