9月21日,华为云CTO张宇昕在华为全联接大会2023主题演讲中表示,大模型重塑千行万业的背后,是众多复杂的技术挑战,需要核心技术的持续创新和突破。华为云以全局的系统性创新,不断攻坚克难,构建AI时代最佳云底座。
华为云CTO张宇昕
张宇昕指出,随着大模型出现能力涌现、多模态融合、MOE等趋势,模型参数将从现在的5400亿很快超过数万亿,对海量的稳定算力、大规模并行训练、以及整体的架构设计都提出了更高要求;同时,数据集规模和Token长度的激增也将带来新的挑战。这些挑战相互影响、环环相扣,可以说大模型及相关应用是迄今为止最复杂的软硬件系统工程。
为应对AI时代的挑战,华为云实现了软硬件结合的系统性创新:
在系统架构层,华为云QingTian架构全新升级分布式QingTian架构,通过打破计算、存储、网络的边界,把过去主从式架构升级为对等架构,极大地提升了AI算力。
基于分布式QingTian架构,华为云昇腾AI云服务提供了算力集群、计算引擎CANN、AI开发框架MindSpore和AI开发平台ModelArts,为大模型和AI应用的开发、运行提供最佳算力服务。
在数据处理层,华为云提供云上全流程一站式能力,包括数据存储、分析、共享、标注方案,让企业实现大模型数据“找得到”“存得下”“记得住”“用得了”。
在AI云存储方面,华为云独创了具备220TB超大带宽和微秒级超低时延的内存服务EMS,以此支持NPU/GPU的内存扩展,可以容纳PB级超大规模参数,让参数存得下;同时,基于SFS Turbo文件存储的大并发、高吞吐缓存服务,可提供千万级IOPS,将10亿条数据和元数据的准备时间从100小时缩短至5小时,让数据准备速度快;此外,基于OBS对象存储构建的低成本大容量知识湖服务,通过深度归档、智能存储分级和存储管理统计平台实现数据精细化管理,数据和向量的存储TCO降低30%,让海量数据存得起。
作为大模型的“超级外脑”,向量数据库是AI时代的刚需产品。华为云GaussDB向量数据库具备千亿级大规模向量数据快速查询更新的能力,检索规模提升10倍,查询时延<10ms,响应速度提升2倍。另外,GaussDB向量数据库具有千维查询能力,查询结果更精准,助力企业业务更智能。
数据是大模型的源泉,华为云数智融合平台通过统一的数据资源和元数据技术LakeFormation等四大关键技术为大模型提供更高效、高质量的数据底座。同时,华为云全新发布智能数据洞察产品DataArts Insight,对数据资产进行了语义扩展和领域知识关联,让大模型在消费阶段的调优和推理效率倍增。
为了给大模型高质量“供数”、让大模型高安全“用数”,华为云推出了高质量、高安全的数据要素流通解决方案:基于TICS隐私计算和区块链BCS服务,提供可信数据开发环境,帮助客户把高价值数据变成高质量数据集产品,实现可用不可见、全流程可溯。EDS交换数据空间支持20多种控制策略,让数据在授权范围内可信地流通。
此外,为了给大模型训练打造安全高效的AI标注环境,华为云推出AI标注云桌面,让分散在各地的标注员可以远程接入;敏感数据始终保存在云端安全专区,满足安全合规的要求;同时,云端实时加载,结合华为云HDP高清显示协议毫秒级传输,实现图像本地显示时延降低50%以上。
在模型训练层,华为云通过盘古大模型的“5+N+X”的架构实现分层解耦,赋能千行万业,让每个行业、每个企业基于自己的场景都可以拥有自己的大模型。盘古大模型L0层提供了5个基础大模型,包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型,提供满足行业场景的多种技能;L1层包括N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,也可以基于行业客户的自有数据,在盘古大模型L0或L1层基础上,为客户训练自己的专有大模型;L2层为客户提供更多专注于具体应用场景或特定业务的模型,提供开箱即用的模型服务。
在应用开发层,华为云整合了应用开发需要的开发生产线、低码/无码平台、AI应用框架及全新的AI应用工程套件,让客户轻松实现基于大模型的AI原生应用的零门槛构建。
例如,大模型应用既需要多样化的AI原生技术,又需要强大的工程能力,同时也要具备小颗粒、敏捷部署能力。为此华为云打造了AI应用框架:首先,将一系列的AI原生技术构筑成后端服务,形成BaaS for AI能力,调用即可得;其次,将大模型的工程经验做成工程平台,让开发者以5倍速全链路开发行业大模型及应用;最后,基于Serverless技术,通过面向AI全新升级的FunctionGraph 3.0提供AI的前端开发框架,利用其“胶水”式拼接能力,将BaaS for AI 后端和大模型工程套件快速拼接、无缝集成。
张宇昕表示,华为云这些系统性创新的云服务能力,可以跨云、网、边、端等多平台,以及公有云,边缘云、混合云等多形态,实现灵活自由的部署和应用。对于建立专属AI平台和大模型的需求,企业可通过华为云Stack平台,在自有数据中心部署AI云服务和大模型的关键产品,一站式建设专属大模型。会上,张宇昕正式发布华为云Stack 8.3,相关服务将于9月底全面上市商用。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )