网宿徐明微:高密度算力和低TCO将驱动液冷快速渗透

随着AI技术的应用爆发,高性能、高密度计算设备部署成为数据中心新常态。为了应对高密度计算带来的高热负荷和散热挑战,液冷以其高效的散热性能和节能特点,成为理想解决方案。

日前,在2024中国云计算和数据中心国际峰会上,网宿科技子公司绿色云图运营总监徐明微与一众专家共同探讨了液冷技术的发展趋势。

徐明微强调,风冷和液冷在散热能力上存在一个分界点,风冷可以很好地满足250W以下的散热需求,但随着芯片功耗的不断攀升,如一般GPU的功耗已达到350至700W,NVIDIA B200的功耗超过1000W、GB200的功耗高达2700W,这些已经远远超出风冷的散热极限,液冷散热是必然选择。比如绿色云图新一代的液冷方案就能满足kW级功耗芯片的散热需求。

数据显示,截至2022年底,数据中心的液冷技术渗透率仅为5%至8%。而根据全球高科技产业研究机构TrendForce集邦咨询的最新调查,随着NVIDIA Blackwell新平台预计于2024年第四季出货,将推动液冷散热方案的渗透率明显增长,预计从2024年的10%增长至2025年的超过20%。

在业界共识中,一方面,由高密度计算所带来的散热需求以及政策对PUE的严格管控是液冷技术发展的主要驱动力,另一方面,数据中心的总体拥有成本(Total Cost of Ownership, TCO)也是推动液冷技术规模化应用的关键因素。

会上,徐明微举例阐释了液冷技术对数据中心TCO的好处。

风冷的PUE值大概在1.4,浸没液冷PUE值可以达到1.1以下,甚至到1.05。传统服务器,风扇占到功耗的10~20%,液冷模式去除了风扇的功耗,以一台100W的服务器为例,拆掉风扇后就变成了80W,乘以PUE1.1的系数,液冷模式下的整体功耗就是88W,而风冷的模式下,整体功耗是140W。这样一来,液冷相较于风冷可以降低功耗37.14%。

“数据中心建设过程中,投资成本(CAPEX)以及运营成本(OPEX)分别占到30%、70%,那液冷的节能就体现在OPEX环节,节能30%以上。在CAPEX没有明显增加的情况下,显然液冷的TCO优于风冷,对数据中心长远来说具有更好的经济效益。”徐明微表示。

与会专家也指出,从运营角度,出于TCO成本的考虑,为了达到数据中心一个好的投资回报率,液冷将成为主流的散热方式,没有之一。

最后,谈及AI芯片对液冷技术的影响,徐明微表示,“尽管芯片功率上升到了kW级别,但芯片的面积也随之增加了,也就是单位面积的功耗没有大的提升。在这种情况下,我们认为,现有的液冷技术是完全可以来进行高效散热的。芯片不是单纯的发热器件,而是超大规模的集成电路,真正的难点在于怎么有效地将热量传递到芯片表面。我们现阶段要做的事情就是把液冷技术不断地优化,做到更安全可靠。”

据悉,绿色云图作为国内领先的液冷数据中心解决方案提供商,近年来不断提升液冷技术的性能和效率,以满足高算力设备的散热需求,并已在大型超算场景中成功实施液冷方案。与此同时,绿色云图积极携手戴尔科技、英特尔、华鲲振宇等合作伙伴,开展液冷散热系统的研发、测试、验证等系列工作,以产业生态力量加快推动液冷技术的规模化普及。(御风)

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2024-09-29
网宿徐明微:高密度算力和低TCO将驱动液冷快速渗透
随着AI技术的应用爆发,高性能、高密度计算设备部署成为数据中心新常态。

长按扫码 阅读全文