鲲鹏和Pro:华为云BigData Pro大数据解决方案的两大“关键词”

关于华为,每个人都有自己的观察角度,聚焦企业级IT市场,本文讲讲最近一段时间我看到的华为实力。我的切入点是鲲鹏,更进一步说是华为云最新发布的业界首个鲲鹏大数据解决方案——BigData Pro。

先说说鲲鹏,这个最近一段时间华为最频繁提及的词汇之一。明白了鲲鹏,对于鲲鹏大数据解决方案也就理解了一大半。

“鲲鹏”是什么?

可能你已经看到了,华为近期密集地发布了各种带着鲲鹏字样的产品、解决方案,包括鲲鹏处理器、鲲鹏云服务,其中就包括本文将重点展开的华为云鲲鹏大数据解决方案——BigData Pro。

鲲鹏究竟是什么?

简单理解,鲲鹏是一套基础架构体系,不仅仅局限于鲲鹏系列服务器芯片,还包含了兼容的服务器软件,以及建立在新计算架构上的完整软硬件生态和云计算生态。

最初, 鲲鹏指华为在今年1月初发布的一款基于ARM指令集的通用计算芯片鲲鹏920。

为什么华为在大力发展鲲鹏?原因有很多,最直接的因素就是必须拥有自己的核心技术。

本质原因则是摩尔定律正在失效,计算体系进入百花齐放的时代,鲲鹏的发布,给客户带来了更多元的选择。

华为云鲲鹏大数据解决方案(BigData Pro)第一个值得关注的点,正如华为云云存储服务总经理林超所说,不管是存储还是计算,都是基于鲲鹏架构实现的。这在业内目前也是独一份。

华为云云存储服务总经理林超

了解过鲲鹏后,接下来认识一下鲲鹏大数据解决方案的第二个关键词Pro。在消费级产品领域,Pro被用的很多了,字面意思专业版,更直观的认识,Pro的功能会更强大。

那么,华为云鲲鹏大数据的Pro体现在哪些方面?我觉得可以总结为三个维度:

“存算分离”——提升资源利用率

华为云对传统的大数据架构进行了升级,推出了基于云服务的存算分离架构。存储和计算资源可以根据业务需要各自独立进行弹性扩展,灵活配置,从而使资源匹配更精准、更合理,让大数据集群资源利用率大幅提升。据介绍,经此创新,综合分析成本最高可降低50%。

至于为什么要这样做?还得从大数据架构的限制说起。目前,业界使用最多的大数据架构是Hadoop,而当初设计的时候,它基于计算和数据就近处理的原则,采用计算和存储融合的架构,通俗的理解就是“一体机”。按照一体机的设计,计算和存储的比例是固定的,这显然不符合实际业务需求,无形中造成很多浪费。

有一组数据供参考,在原有存算一体方案中,计算资源的利用率一般不到50%,存储空间的利用率一般不到33%。换句话说,大量的计算、存储资源都被浪费了。

华为云BigData Pro鲲鹏大数据方案能将大数据集群的资源利用率提升75%,成本最高可降低50%。

多协议互通数据分析效率大增

在鲲鹏大数据解决方案中,华为云使用OBS对象存储来管理企业海量数据。OBS具备业界领先的性能,支持千万TPS超高并发,单流2.4Gb/s单流带宽,超业界3倍,小对象10ms稳定低时延。在此基础之上,华为云还做了很多创新。

比如,OBS对象存储服务的多协议互通。什么意思?没有这个能力之前,企业不同格式的数据是存储在不同存储系统中的,在进行数据分析时,需要进行协议转换,影响效率不说,转换完成后还要另存一份,又造成存储空间浪费。有了多协议互通,数据可以通过计算、存储的接口,或者HDFS的接口写进来,然后再通过另外的协议,包括POSIX等读出去,相当于一个数据可以用多种语义解读,省去了转换过程,效率大增。据测算,单此一项创新就能帮助数据访问效率提升25%。这是华为云对象存储服务的一个独特优势。

再比如,基于对象存储华为云创新了修改写和追加写。原来的修改写和追加写,按照传统厂商们的做法,修改写相当于先新增一个数据,然后把老数据删掉,需要两个步骤。现在华为云可以做到直接修改,对于处理大文件,这项能力尤其有用。

其三,华为云在OBS对象存储上实现了HDFS原生接口。

量变产生质变,一点点小的创新积累,使存储不再是大数据分析过程中的性能瓶颈。所以,同样是存算分离,可以说华为云比友商多走了半步,能带给用户更高的效率,更优的成本。

这还不够,别忘了鲲鹏大数据解决方案还有一个Pro,它与鲲鹏的特性紧密相关,这也是为什么开篇会说,明白了鲲鹏也就了解了鲲鹏大数据解决方案的一大半。究竟是什么?

鲲鹏多核从容应对数据高并发

首先,就鲲鹏本身而言,多核优势再加上华为云在任务调度上的算法优化,使得CPU的并发能力很强。另外,CPU内存通道更多,从6个提升到8个,支持的内存速度更高,从2666MHz提升到2933MHz,内存带宽提升46%,而众所周知,内存带宽的提升对于大数据的场景优势非常明显。

其次,华为云鲲鹏大数据解决方案率先采用鲲鹏云容器技术,并做了很多独有的创新。比如:

华为云对开源k8s进行了深度优化,能够达到1秒1000个容器发放的弹性能力,特别有利于实时大数据分析对业务浪涌的弹性响应,并且引入Volcano队列批量调度技术,支持容器的智能拉起等,让企业大数据分析业务编排更加灵活。

更多细节不再一一展开。据悉,华为云鲲鹏容器服务在大数据应用场景下,端到端的性能提升达到40%。也就是说,在存算分离的大框架下,华为云不仅是面向存储,针对计算同样也做了很多技术创新。

截至当前,BigData Pro大数据解决方案已经在部分顶级互联网客户的业务场景得以应用,包括用户画像、实时数据分析等,能有效降低35%的大数据分析用时,反馈良好。

大数据体系再完备 客户需要的都有

加上鲲鹏大数据解决方案,华为云也成为业界能提供大数据解决方案最丰富的服务商,从x86到鲲鹏,从容器、云主机到裸金属,从云计算到云存储,往上再到EI大数据服务,各种各样的大数据应用场景需求,华为云都能满足。

事实上,这也正是当前大数据领域的发展趋势。业界都看到了海量数据带来的挑战,特别是随着5G、IoT、VR/AR、自动驾驶等技术的发展,数据的爆发速度会越来越快。华为曾在GIV 2025报告中指出:“预计到2025年,全球每年新增数据存储量为180ZB,企业的数据利用率将会达到86%。”

如此大的压力之下,现有大数据分析系统已经难以满足其增长需求,数据增长和现有IT架构处理能力之间的不平衡只会越来越明显。

为此,业界知名分析机构IDC在最新的报告中就明确指出:企业上云已成必然趋势。因此,在公有云上部署更灵活高效的大数据分析平台,将成为企业应对大数据时代的必然选择。

于是,我们也看到所有云服务商都在朝这个方向努力,正在推出更多的产品与解决方案。华为云也是其中的一份子。但有所不同的是,华为云基于华为过去的积累有很多独有的优势,包括存储、计算领域的,而这也将成为其未来重要的竞争力。

总结全文,透过华为云鲲鹏大数据解决方案BigData Pro观察华为云。他们要做的不仅仅是给用户多一种选择(鲲鹏),更是给出一种匹配企业业务需求的最佳方案,这也符合华为以客户为中心的企业文化。相信华为云未来会有更多基于鲲鹏算力的解决方案问世,为企业客户的数字化智能转型带来切实的效益。

9月18日-9月20日,2019华为全联接大会(HUAWEI CONNECT 2019)将在上海世博中心举办,各种最新黑科技、产品与解决方案将重磅亮相,敬请期待。阅读原文”。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2019-09-03
鲲鹏和Pro:华为云BigData Pro大数据解决方案的两大“关键词”
我的切入点是鲲鹏,更进一步说是华为云最新发布的业界首个鲲鹏大数据解决方案——BigDataPro。

长按扫码 阅读全文