3月3日消息(水易)以ChatGPT为代表的生成式AI应用火爆全球,推动AI技术变革。为了应对这一趋势,各大互联网公司相继布局类ChatGPT技术。当我们惊叹它的智力时,需要认识到它的背后是高算力基础设施的支撑,数据中心迎来变革。
这一变革除了系统层面的服务器、存储、网络的持续升级,还有在持续高负荷的运行下,数据中心的热管理、散热、能源等环节也需要引入一些新技术进行改造。
三河同飞制冷股份有限公司副总经理/CTO陈振国在第十七届中国IDC产业年度大典期间对C114表示,随着数据中心热密度的增加、机房功率的增加,热管理、散热需求也在逐渐增加,需要新型冷却技术不断提升服务器效率和稳定性以及整体能源利用率。
未来三年,液冷将进入爆发期
众所周知,系统发热和系统工作比率是热管理系统的重要参数,早期数据中心的工作比率较低,负荷不到60%。但是随着高算力的应用的出现,对数据中心算力的要求越来越高,而算力的负荷也越来越高。
陈振国指出,面对这一趋势,再加上国家对数据中心能耗标准的落地,传统的风冷技术在能耗方面已达不到相关需求。因此数据中心温控向液冷方向发展的趋势非常明显。
基于这一判断,依托在电力电子行业20多年液冷技术的积淀,同飞股份开始布局数据中心液冷。“选择液冷作为发展方向,首先跟同飞现有的技术非常契合,电力电子行业的液冷技术已经非常成熟,可以直接转到数据中心场景下。另外也是看到了数据中心液冷的发展前景。”
据介绍,同飞股份自主研发生产的板式液冷系统由干冷器、补冷机组、CDU、环形管路和Manifold终端等部分组成。在全年大部分时间可以利用自然的冷源支持服务器散热,PUE能降到 1.1以下。与此同时,系统采用干冷机和补冷机组,可以做到WUE为0,系统不耗水,能够解决结冰、结垢以及系统腐蚀问题,极大降低维护成本。
陈振国认为,液冷成为数据中心主流散热方案的趋势不可逆,首先在标准方面已经成熟,特别是对PUE指标的规定;另外在产业链层面,液冷服务器已经开始落地。不过在建设方和应用方层面还有阻力,特别是应用方对于液冷的可靠性还存在疑虑,因为这关系到企业业务发展的命脉。
因此,数据中心向液冷方向发展是一个循序渐进的过程,在这个阶段,可以把精密空调、列间空调,包括风墙、AHU等作为过渡阶段的一个补充。陈振国表示,“利用两、三年的时间,大家有了液冷的应用经验,感受到液冷服务器的优势,大家会逐渐的打消疑虑,我想这整个行业也就迎来了它爆发的时刻。”
智能化手段确保数据中心安全
前面提到,算力需求的持续增长,特别是AI算力的需求猛增,对数据中心热管理提出新的需求。那么反过来,随着AI模型的不断优化,人工智能可以做的事情也越来越多,对数据中心的温控方案也在持续赋能。
陈振国表示,虽然AI模型的训练对数据中心能耗带来挑战,但是一些基于AI的智能化调配、优化的手段,又使数据中心的能耗有所下降。例如,当遇到大算力的时候可以自动把水泵的流量放到100%;当小算力的时候,把水泵的流量放到20%-30%,提高能效比。“这也对热管理系统也提出了更加弹性且柔性的要求。”
另外,智能化也应用到了对同飞产品的生产工艺上。据介绍,目前同飞的所有制造设备都已经联网,可以与部分客户的MES系统进行组网对接,客户能够实时监控整个生产制造过程,进而实现产品品质的提升。
为什么需要智能化的手段?对于数据中心而言,内部基本都是复杂的电子元器件,能耗也高,热管理做的不到位,火灾等安全隐患很大,业务中断的影响不可估量。陈振国表示,利用智能化方式,能够精准把握温度波动变化,精准检测设备好坏,再通过弹性冗余的系统设置,保障系统的稳定性和可靠性。
当然,智能化的引入,也带来了一定的信息安全风险。陈振国表示,所有的软件系统要经过严格的评估,甚至是专业机构的评估。避免通过控制系统侵入整个数据中心系统或是被远程控制了冷却系统,造成数据中心信息的损失,给整个数据中心带来危害。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。