3月20日消息,亚马逊云科技和英伟达宣布,英伟达在2024年GTC大会上推出的新一代NVIDIA Blackwell GPU平台即将登陆亚马逊云科技。亚马逊云科技将提供NVIDIA GB200 Grace Blackwell Superchip和 B100 Tensor Core GPU。
英伟达Blackwell在亚马逊云科技上的应用,使得该平台在应对资源密集型和数万亿参数语言模型等推理工作负载加速方面实现了巨大飞跃。
NVIDIA GB200 Grace Blackwell Superchip和 B100 Tensor Core GPU是英伟达刚刚在2024年GTC大会推出的最新GPU产品。
新的NVIDIA B200 GPU 由 2080 亿个晶体管组成,而NVIDIA GB200 包含了两个 B200 GPU 和一个 Grace CPU。
Blackwell 在单芯片训练方面的 FP8 性能是其上一代架构的 2.5 倍,在推理方面的 FP4 性能是其上一代架构的 5 倍。在具有 1750 亿个参数的 GPT-3 大语言模型基准测试中,GB200 性能是 H100 的 7 倍,训练速度是 H100 的 4 倍,成本和能耗上GB200 比 H100 降低了 25 倍。
据介绍,亚马逊云科技将提供配置GB200 NVL72的英伟达Blackwell平台,它配备72颗Blackwell GPU和36颗Grace CPU,通过第五代NVIDIA NVLink互连。当与亚马逊云科技的EFA网络、Amazon Nitro高级虚拟化系统和Amazon EC2 UltraClusters超大规模集群等技术结合时,客户能够轻松扩展至数千个GB200 Superchips。
NVIDIA GB200 NVL72 是一种多节点、液冷、机架级系统,利用 Blackwell 为万亿参数模型提供强力计算,在单个机架中可实现 720 petaflops 的 AI 训练性能和1.4 exaflops 的AI推理性能。
在安全性方面,亚马逊云科技的Nitro 系统、Amazon KMS、EFA加密 和 Blackwell 加密的集成将为客户提供对其训练数据和模型权重的端到端控制,从而为客户在亚马逊云科技上的生成式AI应用程序提供更强的安全性。
Blackwell也加入了双方合作的Project Ceiba项目,该项目专为NVIDIA自身的AI研发工作设计,是一台亚马逊云科技上托管的采用DGX Cloud的AI超级计算机,它搭载了20,736颗GB200 Superchips芯片,并通过第四代EFA网络扩展,为每个Superchip提供高达800 Gbps的低延迟、高带宽网络吞吐量,能够提供414 exaflops的计算能力,与之前计划在Hopper架构上构建Ceiba相比,性能提升了6倍。
同时,亚马逊云科技与英伟达联手,通过Amazon SageMaker与NVIDIA NIM推理微服务的整合,提供了高性能、低成本的生成式AI推理解决方案,该服务作为NVIDIA AI企业版的一部分提供。客户可以利用这一组合在Amazon SageMaker中快速部署和运行已预编译且对NVIDIA GPU进行优化的基础模型,缩短生成式AI应用的推出时间。
亚马逊云科技与英伟达还在利用计算机辅助的药物发现领域进行合作拓展,推出了新的NVIDIA BioNeMo基础模型,用于生成化学、蛋白质结构预测,以及理解药物分子与目标的相互作用。这些新模型将很快在Amazon HealthOmics上提供,这是一个专为帮助医疗保健和生命科学组织存储、查询和分析基因组、转录组及其他组学数据而设计的专用服务。
Amazon HealthOmics和英伟达医疗保健团队还合作推出生成式AI微服务,以推进药物发现、医疗技术和数字健康领域的发展,该服务提供一个新的GPU加速的云端服务目录,涵盖生物学、化学、成像和医疗保健数据,以便医疗企业能够在亚马逊云科技上利用生成式AI的最新成果。
亚马逊云科技首席执行官Adam Selipsky表示:“我们双方的深入合作可以追溯到13年前,当时我们共同推出了世界上第一个亚马逊云科技上的GPU云实例,而今天我们为客户提供了最广泛的英伟达GPU解决方案。英伟达的下一代Grace Blackwell处理器是生成式AI和GPU计算领域的标志性事件。当结合亚马逊云科技强大的EFA网络、Amazon EC2 UltraClusters的超大规模集群功能,以及我们独有的Amazon Nitro高级虚拟化系统及其安全功能时,我们就能够使客户更快、更大规模且更安全地构建和运行具有数万亿参数的大型语言模型。”(果青)
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 蔚来第三品牌firefly萤火虫首款车型正式亮相 预售价14.88万元
- 首发线控转向等多项技术 蔚来旗舰车型ET9正式上市:78.8万元起
- Fortinet李宏凯:2025年在中国大陆启动SASE PoP节点部署 助力企业出海
- Fortinet李宏凯:2024年Fortinet全球客户已超80万
- 网信办:从严打击网上侵害未成年人合法权益行为
- 豆包大模型全面升级,相关概念股疯涨,字节发布紧急警示
- TechWeb微晚报:“小红书封号”冲上热搜,小米YU7无伪装实车首次曝光
- “小米SU7坠崖一家四口安然无恙”冲上热搜 车主回应
- 奇富科技发布AI产品小奇等金融AI大模型成果
- 消息称极越公关负责人被开除 当事人回应了
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。