如今,人工智能 (AI) 和其他高耗电计算和数据处理应用的快速增长,推动了全球大型数据中心设施部署的爆炸性扩展。数据中心行业面临着越来越大的压力,需要减少其对全球排放的贡献,同时满足提供更多处理能力的需求。而同时满足增加处理量和减少碳排放的需求的一种解决方案,是在可再生能源生产地点或附近增加数据中心的选址。
未来,大量可再生能源的可用性可以打破大规模计算的成本曲线。对于大型计算中心,能源占运营成本的很大一部分,在设备的整个生命周期中,能源成本可以达到与资本投资大致相同的水平。
风能和太阳能的利用越来越多,但与以前的可再生能源(例如水力发电厂)不同,每种能源在一天中的可用性和成本都存在明显变化(有时甚至为负)。为了充分利用这些能源,数据中心需要高度自动化,并且最好位于这些能源附近的偏远地区,以降低传输成本。
例如,美国国家科学基金会 (NSF) 云与自主计算 (CAC) 产学合作研究中心在数据中心自动化、分析和控制标准方面的工作将在这些流程和方法方面拥有数十年经验的领导层的专业知识应用于解决这个问题。通过与全球领先的标准制定组织,例如分布式管理任务组 (DMTF)、存储网络行业协会 (SNIA) 和开放网格论坛 (OGF))合作,并与他们合作开发、测试和实施标准。
CAC最近的项目越来越关注在远程和可再生能源供电环境中实际采用数据中心自动化、分析和控制所需的标准。CAC 与 DMTF、SNIA 和 OGF 合作,对 Redfish 和 Swordfish 标准进行了广泛的测试,这些标准用于数据中心基础设施为计算和存储设备、数据传输和操作以及越来越多的范围的电气管理和自动化提供此类功能。在风能和太阳能使用中隐含的可变能源可用性条件下,这种自动化和控制对于数据中心的成功部署和运营至关重要,并且同样可以为其他环境带来成本效益。
全球领先的设施
CAC 与德克萨斯理工大学 (TTU) 全球能源资产管理和制造实验室 (GLEAMM) 密切合作,该实验室的核心使命是与美国联邦机构、州机构、私营机构合作,吸引并开展能源领域部门和其他大学的多学科研究。GLEAMM 的使命是验证、证实和表征能源领域使用的现有技术,以及开发新的尖端技术并通过研究商业化和科学出版物向公众提供这些技术。
GLEAMM 拥有专门针对电网基础设施现代化和可再生能源研究而定制的广泛功能。GLEAMM 资源包括 150 kW 太阳能电池阵列、与通用电气 (GE) 和桑迪亚国家实验室合作的多个数百 kVA 规模的风力涡轮机、一系列分布式相量测量单元 (PMU),用于监控电网、1MW可编程电阻负载、187kVAR可编程负载、30kW四象限逆变器、500kW柴油发电机、81.6kWh储能系统以及配备电压和电流传感器的控制楼用于数据采集和当地气象站。因此,这些能源生成和存储能力涵盖了新数据中心部署中可能遇到的各种能源。
GLEAMM 微电网将德克萨斯理工大学的研究和商业化专业知识与下一代行业技术相结合,用于保护、增强和管理电力传输和分配。GLEAMM 的主要目标是为与可再生能源和微电网相关的不同领域(例如现代化、能源管理、电能质量、控制和运营)的创新研究提供功能完整的基础设施。
除了这些硬件能力之外,GLEAMM还拥有OPAL-RT“硬件在环”(HIL)仿真设备,用于将基于计算机的模型与硬件设备合并,以研究两者之间的相互作用。在软件仿真能力方面,GLEAMM拥有PSSE、PSCAD、PowerWorld、Exata CPS、VOLTRON等多种行业标准工具的授权。CAC 的模拟和计算资源可用于补充现实世界的设备,使用这些资源来建模和理解更大设施的行为。
这些资源和设施位于德克萨斯州拉伯克以西里斯中心的 GLEAMM 站点。该中心前身是空军基地,现在设有一系列学术教学和研究设施以及几个工业租户,距离德克萨斯理工大学主校区约 20 分钟车程。GLEAMM 可以直接从三座 300 kVA 峰值容量研究风塔(每个在风速 11 m/s 时发电约 200 kW)以及位于里斯中心的 150 kVA 峰值容量太阳能电池阵获取电力。这些风塔由桑迪亚国家实验室运营,直接连接到控制设备所在的 GLEAMM 微电网大楼的开关设备。
对于任何给定的负载,需要持续供电的资源(例如,为了保持系统准备状态、管理访问和可用性以及维护基本功能)可以通过外部商用电源或我们的现场柴油发电机作为需要的备用电源来保持运行。GLEAMM 设施广泛配备了实验室级传感器和自动化设备,以便在高度仪器化的研究环境中根据本地和分布式电源可用性,对实用方法进行研究,以平滑、调节、操作和平衡工作负载。
通过自动转换开关(ATS),微电网可以根据其运行模式连接到主电网或备用柴油发电机。ATS 在两种可能的场景之间切换微电网运行模式。在最常见的“并网模式”场景中,微电网连接到设施电源,柴油发电机关闭。在极少数情况下,当微电网与设施电源断开并且电池存储的能量和柴油发电机成为系统的主要来源时,会出现称为“孤岛模式”的第二种运行模式。
并网模式到孤岛模式之间的过渡可以是有计划的,也可以是无计划的。当运营商有意做出改变时,首先启动发电机,然后降低绿色发电水平,就会发生计划中的过渡。一旦绿色发电量减少且柴油发电机达到稳定状态,则与电网同步,然后ATS从电网切换到发电机连接。发生这种情况时,重要的是使可再生能源发电量低于负载水平,因为柴油发电机无法消耗任何多余的电力。
如果设施电网缺乏能源,可能会发生计划外的转换。当整个微电网因设施停电而关闭时,太阳能发电厂和风力涡轮机被隔离,柴油发电机自动启动。然而,发电机需要几分钟才能达到稳定状态,然后连接到系统以孤岛模式为微电网供电。在这段短暂的时间间隔内,负载断电,但关键负载和优先负载也会切换到电池备用系统,以在停电期间维持供电。
GLEAMM 微电网配置为为其关键负载提供优先服务,例如由可再生能源供电的数据中心和计算资源。该负载通过与 1600Ah 锂离子电池并联运行的 Outback 逆变器连接到微电网,该逆变器非常类似于传统的不间断电源系统 (UPS),可在其他能源损失时保持可靠性。一旦检测到 Outback 设备的输入断电,其逆变器就会自动将系统与断电隔离,并使用电池为关键负载供电,而不会出现明显的延迟或瞬变。它与传统 UPS 的区别在于组合系统能够处理多个输入电源并适当管理切换。
为了连接主微电网总线 (MCC) 中的所有这些设备,该设施配备了多个断路器、保险丝和命令面板,以确保系统的保护和安全。微电网的操作和控制是通过 SEL-3530 实时自动化控制器 (RTAC) 进行的,该控制器具有双向通信和人机界面 (HMI),允许操作员可视化系统的测量结果并将命令发回到每个设备。此外,位于不同设备中的 Egauge 仪表的测量允许微电网的可观察性、数据采集和监控。
该设施还提供两个相量测量单元 (PMU),用于实时收集电压的幅度、频率和角度。其中一台设备专门用于监控 Outback 逆变器的入口和输出,确保关键负载始终处于可接受的电能质量水平。除了 SEL-3530 之外,所有这些测量结果都会发送到用于数据可视化的远程交互平台和记录此信息以进行事后分析的数据库。除了与所有微电网元件建立双向通信外,RTAC 还包含先前研究项目开发的内部控制算法。
GLEAMM 微电网设备通信系统配置为支持广泛的行业标准和定制测试。部署的算法之一负责控制五个太阳能逆变器,发送发电设定点。这些设定点来自最大功率点跟踪器 (MPPT),它旨在最大化可再生能源或定义值的可用能量。在太阳能发电需要小于负载的情况下,用户界面设定点是孤岛模式操作的关键命令,因此发电机不会消耗剩余电力。最终,如果太阳能发电量高于孤岛模式下的负载,则自动触发柴油发电机的保护,避免该设备消耗任何电力。
RTAC 中的另一个控制装置是 Outback 电池管理器。根据 RTAC 中收集的测量数据,进行计算以跟踪微电网产生和消耗的总电量。每当发电量高于消耗量时,算法就会向内陆逆变器发送命令,以连接到微电网,为关键负载供电并为电池充电。一旦发电量小于消耗量,RTAC 就会指示 Outback 断开微电网并使用电池来维持对关键负载的供电。通过这种控制,我们可以储存产生的多余能源,并在我们没有足够的可再生能源生产时使用它。电池会放电至预定水平,因此它可以安全存储以应对进一步的能量不足,并保护设备免遭深度放电。
作为对物理基础设施的补充,GLEAMM 设施采用了 OPAL-RT 公司的实时数字模拟器,其中整个微电网及其设备被建模为一个完全模拟的系统。该模拟器可用于对真实电气系统进行高可靠性建模,并通过实时仿真跟踪真实电气设备的行为。借助这些设施和完整的微电网模型,GLEAMM 控制可以在虚拟环境中进行测试和验证,而无需担心在各种预计运行条件下对真实电气系统的影响,并用于对可能会出现的工业数据中心更大设施的行为进行建模。
数据中心仪表和可视化
除了上述能源生成、存储和仪器仪表资源之外,CAC 还带来了数十年来在数据中心计算、存储、网络和分布式运营方面积累的丰富经验。CAC 在这些领域拥有先进的能力。
CAC 开发了 DAVinci™ 仪器和自动化工具套件,为数据中心环境中广泛不同的分析需求提供集成方法。DAVinci 与以前的数据收集、自动化和可视化工具不同,它采用了整体端到端设计,可优化数据收集、流程和效率。虽然它与现有的监控或可视化解决方案部分重叠,例如下面讨论的那些,但以前的工具都没有像 DAVinci 那样提供集成框架和耦合的工具套件集。
以前的数据收集基础设施包括单独的基于 IPMI 的服务器无人值守硬件管理、对这些工具的基于 Redfish 的改进、SNMP 工具以及用于检索服务器系统事件日志 (SEL) 数据的工具。有多种特定于设备的协议用于管理和控制硬件设备,例如专用传感器和控制系统、机架和房间配电单元 (PDU) 以及其他定制数据中心设备。其中许多现在可以通过为此目的设计的定制模式收集到通用 Redfish 数据中心自动化和管理协议中。
DAVinci 利用 CAC 开发和测试的 Redfish 协议和工具来收集资源状态。该系统充分利用Redfish的遥测指标定义和采集能力以及服务器端聚合推送数据传输特性来优化和定制数据采集。
DAVinci 的可视化组件构建在数据收集组件之上,为 HPC 系统的态势感知和监控提供交互式视觉表示。可视化需求扩展到以下维度:HPC空间布局(系统中资源的物理位置)、时域(如指标收集器中描述的)和资源指标(如CPU温度、风扇速度、功耗等)。
可视化组件提供跨节点、机架和其他设施的空间和时间视图,并允许 DAVinci 用户按时间序列特征进行过滤,例如用于系统故障排除的温度突然变化。它还允许通过多维分析关联作业和资源指标,并与自动化组件集成,以便使用机器学习技术实现 HPC 系统的表征和预测分析结果。
通过与世界各地的国际标准组织、行业成员和政府机构的合作伙伴关系,CAC 能够帮助您的组织采取必要的步骤来实现实际减排,同时部署更大规模的计算业务能力来满足不断增长的需求。现代世界中人工智能、数据中心运营和数据处理的挑战。
资料来源:CAC
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。