DPU大热背后,NVIDIA的思考和布局

科技云报道原创。

DPU火了,火的猝不及防又理所当然,甚至可以说DPU是当前芯片行业最热的方向,没有之一。

DPU为什么火了?DPU大热背后,是概念炒作还是需求驱动?要回答这个问题,还是得从DPU的价值说起。

DPU,即Data Processing Unit的缩写,直译为数据处理单元。简单总结DPU的三大价值,即卸载、加速、隔离。

卸载,原本需要消耗大量CPU资源却不一定能完成好的服务,比如网络的虚拟交换、虚拟路由,存储的RDMA、NVMe,安全的防火墙、加解密等。

加速,原本需要通过软件并在CPU里运行的一些应用和服务,也就是近些年常听到的“硬件加速”。

隔离,即与CPU运行的任务进行隔离,保证CPU任务的性能和安全性。

其实从DPU的价值定位不难看出,DPU的核心价值主要是在弥补CPU的不足。

事实上,DPU已经不是第一个为弥补CPU能力不足而发扬光大的产品,多年前GPU的大热也是为了弥补CPU在图形处理能力方面的短板。

换句话说,从CPU、GPU再到今天的DPU,技术变革背后体现的其实是时代的变化、用户需求的变化。

伴随数字经济时代的到来,大量数据无法有效及时处理,而这意味着数据蕴藏的价值无法变现。

与此同时,摩尔定律失效,CPU能力增长见顶,而基础架构由硬转软,虚拟化、云计算大规模普及又消耗了大量的CPU资源。

两股力量共同催生、推动新的技术来填补空缺。在这样的大背景下,DPU应需而来,并迅速获得市场认可。

因此,无论GPU还是DPU的出现都是一种必然,是用户需求倒逼技术革新的结果。

未来还可能会出现XPU,但目的只有一个,即更好的支撑数字经济时代的发展。

百家争鸣,谁能笑到最后?

数字经济,毫无疑问的大市场。

巨大的市场需求推动越来越多的玩家进入DPU市场。其中,既有传统芯片巨头如NVIDIA、AMD,也有阿里、华为等云玩家,还有大量新兴创业玩家。据不完全统计,国内致力DPU领域的创业公司有几十家,好不热闹。

出发点不同、技术实力不同,打造的产品解决方案、致力的目标自然不尽相同。

截至当前,DPU领域的玩家大致分为几类,有专注在通用解决方案的,有聚焦在不同使用场景的,如网络、存储、安全等,也有只服务自己生态的。

目前,DPU还处于发展初期,即风口期,我们还无从判断谁能笑到最后。

但透过考量芯片的重要指标,不难去做一些推断,研发芯片最重要的两个维度:一是产品本身,能否满足时代的需求;二是生态,即软件、开发环境和合作伙伴,众所周知,没有生态支撑,芯片只是一粒粒沙子。

两个维度涉及到两方面的实力,一是企业研发实力如何,二是聚合生态的能力如何?

显而易见,只有能顺应用户需求,并有坚强实力做后盾的玩家才有可能决胜到最后,NVIDIA无疑是其中之一。

之所以作出这样的判断,一是底蕴,NVIDIA是做芯片起家的,GPU领域是绝对的王者,进军DPU领域,属于顺理成章;二是格局,GPU领域,NVIDIA搞的就不单是产品,而是生态,有硬件、有软件、有开发环境、有合作伙伴,进军DPU,轻车熟路。

事实也确实如此,尽管业界DPU玩家的起步时间差不多,但NVIDIA当前已经基本完成了在DPU领域的布局,软硬一体,生态优先。

下面详细解读一下NVIDIA在DPU领域的布局。

软硬一体,打造的是体系

同GPU一样,NVIDIA DPU从一开始的定位就不是专用,不是服务于某几个场景,而是数字经济的整个星辰大海。

可以用几个关键词来总结NVIDIA DPU的特质:通用、软硬一体、开放、生态优先。一样一样展开,先看产品。

硬件:NVIDIA BlueField,可以通过对各种高级网络、存储和安全业务进行卸载、加速和隔离,可为云、数据中心或边缘计算等环境中的各种工作负载提供安全加速。

根据使用场景的不同,NVIDIA还可提供BlueField-3 DPU、BlueField-2 DPU及NVIDIA融合加速器多种不同的产品。

软件:NVIDIA NGC目录中提供了NVIDIA DOCA软件框架。

特别值得一提的是,DOCA是NVIDIA为DPU量身打造的软件框架,开发者可以利用DOCA创建高性能、软件定义、云原生、DPU加速的服务,以便对面向未来的数据中心基础设施进行编程。

与此同时,NVIDIA还提供Morpheus软件。作为一个 AI 应用程序框架,Morpheus可为网络安全开发者提供高度优化的AI 流程和预训练的AI 功能,使网络安全开发者能够快速检测和处理安全威胁。

除此之外,经过NVIDIA认证系统认证的NVIDIA EGX平台可提供出色的多节点扩展能力。

从硬件、软件,到开发环境、集成平台,显而易见,NVIDIA不只是专注在研发本身,更愿意赋能,把DPU的能力带给更多的企业、更多的开发者,让更多人享受到DPU的红利。

事实上,为了推动DPU的发展,NVIDIA当前已经落地了非常多有建设性的举措。

比如,2022年初,NVIDIA就授权丽台(上海)信息科技有限公司和上海信弘智能科技有限公司两家合作伙伴设立DPU& DOCA卓越中心,为DOCA中国开发者提供在线实践的免费开发环境,实现编译、运行、测试DOCA应用程序。

另外,在2022年初,NVIDIA还举办了首届DPU中国黑客松竞赛,以赛促学、以赛促发展。

很快在10月,NVIDIA还将举办秋季DPU黑客松比赛,本次竞赛旨在帮助开发者通过 NVIDIA DOCA 软件框架构建创新的 RDMA 加速存储与 AI 应用程序,基于 NVIDIA BlueField DPU与 NVIDIA InfiniBand 网络实现存储、AI 卸载、加速和隔离功能,引领新一代人工智能就绪的基础设施,驱动未来 AI 工厂,欢迎关注。

除了构建软硬一体的产品生态,在合作伙伴生态构建方面,NVIDIA同样下足了力气,除了提供NVIDIA DOCA软件框架供开发者学习使用,还积极与生态伙伴打造面向最终用户的解决方案。

下面透过几个案例来分析NVIDIA DPU真正能带给用户的价值。

中国移动,三大运营商之一,基于Nuage Network和NVIDIA共同打造的SDN 解决方案,显著提高了网络性能,提升了用户满意度。

与单独在软件中运行 OVS-DPDK相比, Nuage Networks VSP和 NVIDIA硬件加速vDPA的联合解决方案使得网络吞吐量增加了1.5倍,数据包转发速度加快了3倍,Apache基准测试每秒支持的请求数增加了7倍。

UCloud,中国云计算第一股。从2018 年起,UCloud开始积极探索基于 NVIDIA BlueField DPU 的高性能的裸金属物理云方案。

截止当前,依托NVIDIA BlueField DPU ,UCloud裸金属物理云方案在网络和存储方面都达到了行业领先水平。

数据为证,UCloud裸金属服务基于 NVIDIA BlueField-2 DPU 可实现99.999999%的数据持久性,并将 IO 时延降低至100微秒,可用性提升至99.95%。

同时由于实现了IO 数据的零拷贝,UCloud UDisk RSSD云盘性能提升至少 20%,单盘4k IOPS 高达75w,带宽高达3GB/s。

网易数帆,网易旗下数字化转型技术及服务供应商。

网易数帆裸金属服务器解决方案利用NVIDIA BlueField DPU不但实现与现有 VPC的兼容互通和协同,而且还将网络相关的工作负载从裸金属服务器主机CPU卸载,释放宝贵的硬件资源给关键业务应用,并实现裸金属服务器网络部署接入的性能加速。

从硬件、软件到社区,再到伙伴,NVIDIA打造的是一个体系,目标是服务整个数字经济时代。

NVIDIA希望通过赋能的方式,将DPU的能力带给更多的企业、更多的开发者,让更多人享受到DPU的红利,而不是将自己局限于产品解决方案供应商这一身份。

能提供价值才是硬道理

DPU市场目前还处于春秋战国时代,谈胜负为时尚早。

可以肯定的是市场足够大,毕竟数字经济时代,数据为王,要想数据发挥出最大的价值,离不开计算。这也是为什么那么多企业涌入这条赛道的原因。

与此同时,历史也在告诉我们,芯片不是一个能快速变现的产业。

这意味着想赚快钱基本是不可能的,只有把更多精力专注在为用户提供价值上,才有可能笑到最后。用这一条去衡量DPU市场的玩家,能满足条件的其实并不多。

为了让广大用户更深入了解DPU,9月19日,2022 GTC大会即将在线上召开,届时NVIDIA将带来一系列关于DPU的分享, 还会有观看派对(Watch Party)特别环节,由 NVIDIA 本地专家主持,中文讲解并实时答疑,欢迎注册,届时观看。

更多活动参与详情

请访问“ NVIDIA 英伟达网络”公众号

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2022-09-16
DPU大热背后,NVIDIA的思考和布局
DPU大热背后,NVIDIA的思考和布局

长按扫码 阅读全文