这两年热炒的一个话题是x86取代小型机,原因在于RAS性能方面两者相似。那么问题来了,x86的性能可以做到多强悍才能媲美小型机?单纯靠英特尔的背后支持?如果所有服务器厂商使用同样的架构、同样的组件,所有x86有啥区别?
这是个好问题。正好专门做技术测试的企事录大牛们(以狒哥张广彬为首)最近测试了一些x86服务器,正在研究这个问题,并撰写了技术白皮书。
白皮书中认为,可以用停机时间这个指标衡量RAS性能,而停机时间取决于三个方面:硬件性能、虚拟化性能和应用软件性能。同时,他们在评测服务器之后,从技术角度阐述了x86服务器如何支撑企业级关键业务应用,以及如何做好x86服务器的日常运维。
来看看他们如何回答这个问题的。
壹 需要99.999的停机时间
迁移的话题谈了很多,这里不打算展开,核心就是关键业务应用从RISC+Unix平台向x86+Linux/Windows平台迁移;从IDC的报告中可以看出,“x86服务器出货量在2015年第二季度增长了8.3%,收入增加9%。RISC/Itanium Unix服务器全球出货量则下滑了18.7%,收入也比去年同期减少了9.7%。”
白皮书重点用停机时间衡量RAS性能,这包括意外停机和计划停机;援用ITIC 2014报告,针对遍布全球的600多家企业调查后发现,79%的企业用户认为需要99.999%(五个九)甚至更好的硬件平台,而在2013年,这一比例为67%,在一年时间内增长了12%。
五个九是什么意思:每年可忍受的停机时间5.26分钟,每个月是25.9秒,每周是6.05秒;如果在银行网上支付这个场景下看,也就是平均每天不能超过1秒;一周累计甚至是一次性不能超过6.05秒;如果你正在支付,网络断了多少秒你就会骂娘?这值得研究。
这个停机时间是从使用者的角度来说;如果要单指系统的话,那就麻烦了。因为加载了N个CPU、N个内存、SSD、硬盘多种设备的服务器重启时间大概10分钟,这可是折磨人。对数据中心来说,怎么做好灾备和恢复,是一个大问题。
当然,如果RAS的性能特别棒,这就不是问题。再来看ITIC2014一个调查结果。在对比14款主流服务器、18款服务器操作系统,和11款运行虚拟化技术的服务器后发现,不管是x86服务器硬件、服务器操作系统还是虚拟化平台,其可靠性都已经接近甚至超过了Unix服务器。
实践出真知,这下就知道为什么大家都想上x86了,价格便宜太多,性能差不多。
有意思的是,在这个表单中,联想的 System x的正常运行时间(可靠性)仅次于IBM System z大机,与IBM Power System持平,超过了其他所有的x86和Unix服务器。这是因为System x的一些技术使用了小型机的技术,这种高端技术下移,确保了产品的性能。
要客观看待这个结果。因为有些服务器(如HP和戴尔的)使用年限超过5年,所以它们整体调查结果偏低。为什么不使用同样年限的机器,原因不可得知。
贰 模块化设计是确保RAS的关键点
企事录的几个大牛正在评测联想的一款高端X6 服务器,型号为System x3850 X6,经过这几个人的插插拔拔,多次“开肠破肚”,找到了System x之所以胜出的几个原因。
白皮书里都有写道,这里就不重复细节,因为这些细节过于技术化。简要总结优点是模块化设计,便捷运维。模块化设计可以说的很细致。核心是,组件模块化设计,包括CPU和内存、硬盘、电源等都单独安装在机箱笼子中,设备间通过背板互联,确保性能最优和高RAS性能。
按照企事录的说法:“这样确保每个组件发挥最大性能,打破I/O的瓶颈,整体提高IOPS的性能。比如支持eXFlash DIMM和PCI-E接口的NVMe,就是确保和CPU距离最短,在IOPS性能上秒杀传统SAN存储。”
模块化设计到了什么地步?核心的CUP和内存同一个系统板上,每块系统板正反两面提供24根DIMM插槽;4块系统板共可以安装96根内存,也就是一台机器最大有6TB的内存容量;像散热风扇、热插拔硬盘、热交换电源、扩展I/O等组件在服务器中都采用了独立设计,可以说,System x X6系列是市面上模块化结构最彻底的服务器产品。
模块化设计的好处是:
1.易于拆卸。能否热插拔的组件以红/蓝标识区别,不会影响系统正常运作;插拔方便,只需动动手,不用螺丝刀就能拆卸。
2.方便升级。按照组件和模块购买,方便用户以后升级;为什么要提出这个观点呢?比如小型机用了5年觉得内存不够用了,需要增加内存;可5年前的内存去哪里找?要升级内存,也许现在主板还不支持,那么一套服务器系统就要全部更换掉,花费又高,又麻烦。全面模块化设计只需要升级部分组件即可,帮助用户节约TCO。
3.扩展性强。支持最新的技术,确保用户的需求,比如支持eXFlash DIMM和PCI-E接口的NVMe,把选择权交给用户,要多大性能就有多大性能。
eXFlash DIMM是联想System x3850 X6支持的一种高性能块存储设备,它的外形类似内存,同样安装在DIMM插槽上,距离处理器最近,具有超低的延时,能大幅度提升数据库的性能,他们在实验室中使用了4条400GB的eXFlash,在Oracle数据库性能测试中获得了47万TPM的高性能。同样具备高IOPS的NVMe存储设备也是System x3850 X6的好选择,它的安装更加简单,插在PCI-E插槽上就能完成安装,容量从400GB到数TB不等,在Oracle数据库性能测试中获得了35万TPM的高性能。
4.方便管理。这里不得不提联想System x独有的IMM2集成管理模块,有效的将IPMI与SNMP功能集成,提供服务器控制和监控功能,远程键盘、显示器、鼠标和虚拟驱动器等功能。简单说,只要服务器能连上网路,远程一切都搞定,不用跑到机房看哪里出了问题。
好吧,这涉及的技术细节太多,不展开说了。等他们的白皮书公布之后,可以去看看。我现在看到的白皮书还在完善中,图形太少,看的不够直接。也许正式公布之后会有更多的图,对这种模块化的设计有更加直接的印象。
对了,再啰嗦几句。据悉,企事录正在搞数据中心级别的测试环境。如果这个环境搞定,神码从CPU、网卡、交换机、路由器、服务器、一体机到整体数据中心,乃至于现在流行的融合架构、超融合设备;还有从应用软件到虚拟化、中间件,通通能评测。要不要来一发?具体联系“企事录”这个公众号吧。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。