Infiniband适配器综合指南

Byfibermall

在这个信息驱动的时代,对快速可靠的数据传输解决方案的需求从未如此高涨。这本全面的手册重点介绍高性能的InfiniBand适配器解决方案。它们的制造方式可以满足当代数据中心、高性能计算(HPC)环境和企业网络的严格要求。

事实上,这些适配器凭借其先进的技术提供了快速的数据传输速率;它们还具有较低的延迟时间和出色的可扩展性。在本文中,我们将研究一些领先的Infiniband适配器的技术规格、性能指标和基本功能,以便在优化数据传输基础设施时做出明智的决定。

InfiniBand适配器到底是什么?

了解InfiniBand技术

在高性能计算和数据中心中,InfiniBand技术是一种常用的高速通信协议。它提供比传统网络协议更好的带宽以及更低的延迟,非常适合需要快速数据传输速率的应用。该协议利用交换结构拓扑,从而允许以非常有效的方式连接多个设备;最大限度地减少拥塞,同时最大限度地提高吞吐量。因此,在这方面,InfiniBand适配器充当该技术所需硬件之间的中介,以实现最佳性能和可靠性。

InfiniBand适配器在数据中心中的作用

数据中心离不开无限带宽适配器,它是确保服务器、存储系统和网络设备之间,高速无缝信息流所必需的重要组件的一部分。这是通过利用无限带宽的低延迟和高带宽功能来实现的,从而促进它们之间快速有效的通信。借助这些适配器,数据密集型应用(如大数据分析、人工智能或科学模拟)可以毫无性能瓶颈地运行。除此之外,它们还具有可扩展性,因此允许服务提供商扩展基础设施,而不会干扰其设施内的网络性能。

InfiniBand适配器与以太网网卡

在将infiniband适配器与以太网卡进行比较时,存在一些技术差异。首先,在带宽和延迟性能指标方面,infiniband比其同类产品具有更高的值。例如,使用这种类型的适配器可以实现数据传输速率达到200Gbps,延迟低至100纳秒;因此,它适合用于高性能计算(HPC)。相反,尽管以太网由于其实施简单而被广泛应用于不同平台,但与具有高级功能的100千兆以太网相比,它仍然提供较低的带宽和较高的延迟。

另一个区别因素在于这两种技术之间的通信协议和拓扑。Infiniband采用的交换结构拓扑为数据传输创建了许多并行路径,从而减少了网络拥塞。由于这一特性,即使在流量负载较大的情况下,以太网中使用的树形拓扑也很容易拥塞。此外,Infiniband在所有设备上都原生支持RDMA,从而通过绕过CPU优化数据传输,从而降低延迟;使用iWARP或RoCE等协议,在以太网上启用RDMA可能无法实现这种优化,因为它们需要额外的配置,并且不能提供类似的性能水平。

是否使用InfiniBand适配器或以太网网卡的决定应基于特定的应用要求,当需要超低延迟和最大吞吐量时,Infiniband变得更可取。

如何选择适合的Infiniband适配器?

各种Infiniband适配器

SDR或单倍数据速率、DDR或双倍数据速率、QDR或四倍数据速率、FDR或十四倍数据速率、EDR或增强数据速率和HDR或高数据速率是Infiniband适配器的不同类型,它们为网络适配器配置提供了多种选项。SDR提供每通道高达2.5Gbps的速度;DDR将其翻倍至每通道5Gbps。QDR的速度甚至更高,每通道速率为10Gbps。FDR可实现14Gbps的有效最大值,而EDR则将其翻倍(每通道25Gbps)。最新的HDR适配器通过每个通道每秒提供高达50Gbps的速度!性能要求和预算是选择Infiniband适配器的主要因素,但请记住,更昂贵的适配器在较低的延迟下提供更高的吞吐量。

Infiniband适配器的关键特性

在选择这些设备中的任何一个时,都必须考虑几个特性,这样不仅可以从它们中获得最大输出,而且还要确保它们与组成计算机系统的其他组件协同工作,这些东西最常被世界各地的人们使用,这取决于每个人对机器的需求。这些包括带宽,更高的数据速率,如EDR(25Gbps/通道)和HDR(50Gbps/通道),更适合超高性能应用;低延迟应该被考虑,特别是在处理需要非常快响应时间的实时进程时;RDMA支持——特别要注意那些具有RDMA功能的InfiniBand,因为此功能有助于减少通过局域网传输大文件时的CPU过载,从而大大提高这种情况下的整体效率。

还要确保它与您当前的硬件兼容,并具有良好的制造商支持和频繁的固件更新。端口数量以及电缆管理功能也不容忽视,特别是在密集的网络环境中工作时,需要在有限的空间内进行许多连接,因此需要正确组织连接这些彼此靠近的不同设备的电缆。最后,考虑成本与可用资源,以便人们不会最终在某些东西上花费超过他们能承受的金额,而这些东西不一定能增加比更便宜的选择所能提供的价值更多的价值。

单端口与双端口适配器:比较

性能、冗余和成本是比较单端口和双端口无限带宽适配器的主要因素。单端口适配器价格较低,可能足以满足小型项目的需求,因为高数据吞吐率并不重要。它们消耗更少的电量,占用更少的物理空间,因此非常适合注重预算的应用程序。但是,双端口适配器通过聚合带宽提供更好的性能,从而支持要求更高的应用,同时还提供故障转移功能,这样当一个链路发生故障时,另一个链路将接管并保持连接,从而减少停机时间并提高可靠性,但与单端口适配器相比成本更高。因此,请根据网络需求、所需的性能水平和预算限制进行选择。

市场上有哪些最好的Infiniband适配器?

首选:NVIDIAMellanoxConnectX-6VPI

NVIDIAMellanoxConnectX-6VPI适配器具有高性能、冗余性和成本效益。它们支持单端口和双端口配置,因此足够灵活,可以满足不同的网络需求。凭借高达200Gb/s的带宽,它们可以有效处理要求严格的应用。除了此功能之外,这些适配器还具有其他增强功能,例如基于硬件的I/O虚拟化和拥塞控制等,这些功能为保护传输中或静止的数据提供了强大的安全措施。经过测试的与各种硬件的兼容性和频繁的固件更新保证了它们的长期可用性。相对于其先进的功能,它们价格合理,适合各种实施。

最佳预算选择:ConnectX-5适配器

ConnectX-5适配器以其价格提供极快的速度,使其成为预算有限项目的最佳选择。它支持高达100Gb/s的单端口和双端口配置,为各种应用提供足够的带宽。此适配器具有高级网络功能虚拟化(NFV)支持、更好的数据包速度和高效的数据路由等功能,从而保证在其整个使用寿命期间(无论适用与否)都具有可靠的性能。除此之外,它还兼容大多数主流操作系统和硬件平台,同时以低功耗运行,因此也节省能源,从而使该设备非常灵活,可以满足不同的网络需求。

高端性能:双端口QSFP56适配器

双端口QSFP56适配器提供无与伦比的功能,每个端口高达200Gb/s,对于任何涉及大数据量处理或在尽可能短的时间内将大文件从一个点传输到另一个点的项目工作负载,高端性能都是必需的,应使用能够足够快地传输如此大量信息的适配器来完成,而不会因为执行这些任务的计算机之间的连接速度不足而出现延迟,以便用户能够按时完成任务而无需等待很长时间。

这些类型也适用于现有网络,因为它们的设计方式使其可以无缝融入其中而不会造成任何形式的中断。此外,这些设备还支持高级网络功能,例如RDMA(远程直接内存访问),以及低延迟,可确保在需要时实现更快的数据处理速率。此外,它们具有比同类产品更多的安全功能,并且经过优化,因此使其成为理想的选择,尤其是在高需求环境中需要尖端技术解决方案的情况下。

安装和配置Infiniband适配器的过程是什么?

安装程序

拆箱并检查适配器:

小心地从包装中取出Infiniband适配器,确保您已收到所有组件(包括文档)。检查卡的物理状况是否有损坏。

关闭和打开系统:

按照适当的安全步骤关闭您的PC/服务器。断开所有电缆并打开机箱,以便访问PCIe插槽。

插入Infiniband适配器:

在主板上找到一个空的PCIe插槽;将卡轻轻插入其中。使用主板提供的螺钉或闩锁装置将卡牢固固定。

重新连接并启动系统:

关闭系统外壳,重新连接所有电缆,然后打开电源。

安装驱动程序和软件:

启动系统后,安装此特定InfiniBand适配器制造商提供的必要驱动程序/软件。通常,需要从制造商网站下载最新驱动程序,并按照其中提供的安装说明进行操作。

配置支持100GbE的网络适配器的网络设置

访问OS网络设置,根据需要设置Infiniband适配器。分配IP地址以及其他附加设置(如果有)。

检查主机总线适配器(HBA)是否已成功安装(InfiniBand):

要验证主机总线适配器(HBA)是否已正确安装,请按照以下步骤操作:首先测试您的网络适配器以检查其是否正常运行。然后,确保通过此端口连接的两个设备之间的连接状态显示“链接正常”。最后,可以进行所需的速度/连接测试。

调整/调节设置:

为了获得更好的性能,可能需要根据特定需求/偏好/条件调整不同的参数,例如RDMA启用数据包节奏调整等。

解决一般问题

适配器无法识别:

● 首先,您必须检查适配器是否正确安装到PCIe插槽中。

● 确保安装最新的驱动程序非常重要。

● 另外,留意可能需要调整的任何BIOS设置。

无网络连接:

● 确保网线连接正确。

● 检查IP地址以及网络设置是否配置正确。

● 重新启动系统和网络交换机。

网络性能缓慢:

● 您必须验证RDMA启用设置。

● 查找导致此问题的网络拥塞或电缆故障。

● 根据使用场景优化高级设置。

间歇性连接问题:

● 应检查固件/驱动程序升级

● 使用不同的PCIe插槽或其他系统进行测试,以确保它识别网络适配器

● 哪些应用可从Infiniband适配器中获益?

高性能计算(HPC)

InfiniBand适配器特别适合高性能计算(HPC)应用,因为它们需要快速的数据吞吐量和低延迟通信。快速移动数据且不受太多干扰是InfiniBand技术的强项;因此,它主要用于科学模拟、财务建模和使用ConnectX-7适配器的大规模数据分析等。这些设备带来的额外带宽显著提高了HPC任务的整体效率和性能,同时也降低了延迟,因此成为任何高级计算基础设施的必备条件。

数据分析和人工智能工作负载

数据分析和人工智能工作负载受益于更高的信息传输速率,这可以帮助它们在InfiniBand适配器的帮助下足够快地处理更大的数据集和更复杂的计算。它确保在模型训练阶段进行高效处理,同时确保实时分析能够轻松进行,因为它具有高吞吐量、低延迟技术的特性,这极大地有助于跨集群内不同节点优化此类负载的可扩展性,从而可以更快地根据涉及大量数据的资源做出决策,尤其是当InfiniBand处理这些数据时。

企业数据中心

加快企业级数据中心内的资源管理,使工作负载优化变得更加容易,这一直是这类设备最擅长的一个关键领域,提供更快的速度,同时最大限度地减少延迟,这只能通过在这样的环境中部署InfiniBand适配器来实现。事务往往会减慢应用的速度,但如果部署得当,它们将确保快速访问信息,从而减少瓶颈,从而提高应用性能,尤其是在事务繁重的环境中。

如何维护和升级InfiniBand适配器?

定期维护技巧

定期固件更新:经常与制造商联系以获取固件更新,以确保最佳性能和保护。

物理检查:检查网络适配器和连接是否有任何损坏、灰尘或磨损迹象。如有必要,请清洁它们并将其牢固拧紧。

温度控制:经常检查设备的温度,并确保通过数据中心的适当冷却将温度保持在建议范围内。

电缆管理:合理布置电缆,防止物理损坏和信号干扰。

更新驱动程序:更新驱动程序将帮助您跟上不断发展的标准,从而提高兼容性,同时为网络适配器添加功能。

监控性能:您应该能够使用网络监控工具,以便跟踪与此适配器性能相关的指标,如果检测到任何异常,则可能无法立即采取行动。

备份配置:定期备份网络适配器的配置始终是一种很好的做法,以便在这些设备出现故障或被更换的情况下快速恢复设置。

何时以及如何升级适配器

性能下降:如果发现性能持续下降或延迟增加,请更新。

以太网和Infiniband适配器的技术进步:安装以利用新技术或新功能,从而大大改善操作。

与EDRInfiniband和100GbE标准不兼容可能会导致网络问题:当较新的软件或硬件与现有适配器不兼容时,请升级。

支持结束:在制造商停止支持当前适配器型号之前升级。

需求增加:升级以有效处理更大的数据吞吐量或增加的工作量。

如何升级

检查兼容性:确保新的适配器与您的其余基础设施和软件兼容。

备份配置:备份当前在此卡(适配器)上应用的所有设置和配置。

停机计划:安排在使用率较低的时段,尽可能避免中断。

固件和驱动程序安装:安装更新的固件版本以及适合此特定类型/品牌/型号的驱动程序;通常可以从供应商的网站免费下载。

升级后测试:执行各种测试,以便我们可以确定升级后的卡在技术上和实践上都表现得足够好。例如,终端用户不会遇到任何减速现象。

更新文档:更新与这些步骤中所做的硬件更改相关的系统文档。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2024-07-09
Infiniband适配器综合指南
在本文中,我们将研究一些领先的​​Infiniband适配器的技术规格、性能指标和基本功能,以便在优化数据传输基础设施时做出明智的决定。

长按扫码 阅读全文