随着大模型训练和计算能力的迅速增长,国际上以GPT-4为代表的大型模型训练产品热度居高不下,而国内的文心一言也宣布向全社会开放。然而,国内大型模型训练面临高昂的成本及主流核心部件供应不足的限制,从而在替换和迁移方案方面存在较大掣肘。
为了解决上述问题,Intel近期推出了第二代Gaudi深度学习加速器——Habana Gaudi2。Gaudi2以其领先的性价比优势和稳定的供应体系,旨在成为大规模AI部署的更优选择。超云作为国内专业的数据中心产品及服务提供商,紧跟Intel前沿技术,迅速部署产品研发资源,正式推出了基于英特尔AI加速卡的全新产品——AI服务器R8868 G13。
超云R8868 G13
Gaudi2深度学习加速器在第一代Gaudi高性能架构的基础上,在多方面提升了性能和能效比,从而加速了高性能大型语言模型的运行。该加速器具备以下特点:
1、24个可编程的张量处理器核心(TPCs);
2、21个100Gbps(RoCEv2)以太网接口;
3、96GB的HBM2E内存容量;
4、2.4TB/秒的总内存带宽;
5、48MB的片上SRAM;
6、集成了多媒体处理引擎。
Gaudi2在GPT-3的评测中也展示出了其性价比优势:Intel使用了384块Gaudi2加速器,在311分钟内完成了训练,从256个加速器扩展到384个加速器,实现了近线性95%的性能提升。
英特尔发布Gaudi2加速器
一直以来,超云在 AI 算力领域扮演着重要角色,作为国内率先推出基于 Gaudi2 产品方案的厂商之一,超云 AI 服务器 R8868 G13 集成了 8 块 Gaudi2 加速卡 HL-225B,同时可支持 2 颗英特尔®第四代 Xeon EGS 系列处理器。此前,超云连续三年获得"Intel钛金级合作伙伴"荣誉,双方在产品研发和技术突破方面保持着密切合作。本次产品方案的推出不仅是双方紧密合作的有力证明,也充分展示了超云在 AI 领域的实力。
通过有效的产品部署,超云迅速为客户提供了高质量、高性价比的解决方案,成为国内首家推出一体化全栈解决方案的厂商。目前,该方案正在进入测试和收尾阶段,通过这一优质解决方案的复制,超云占据了市场先机,获得了越来越多互联网巨头的关注和认可。
随着大模型在各领域的商业化落地,大语言模型及生成式 AI 的需求不断扩大,市场对高性价比硬件服务器的需求也随之变得更加迫切。基于 Gaudi2 的 R8868 G13 服务器,使超云在性能和性价比方面具备领先优势。
未来,超云对与英特尔的合作充满信心,双方将借助深化合作和技术迭代,提供更高的深度学习性能,进一步帮助客户提升收益价值,加速国内大模型的创新和迭代,推动各行业领域的数字经济发展。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )