向上而生,华为云基础设施服务高可靠之路

著名科学家钱学森说过:”可靠性是设计出来,生产出来的,管理出来的“。公有云的可靠性,一直被人关注,并作为用户选择重要指标。可靠性做的好就无感知,当你感知到,那肯定已经出现问题了。华为云近期推出了“选择华为云更可靠”的海报,今天我们就谈一谈华为云基础设施服务的高可靠之路。

向上而生,华为云基础设施服务高可靠之路

产品设计理念:”可靠性为先”

华为云基础设施服务的设计理念是以可靠性为先,所以在技术规划阶段,就已经包含了包括业务连续性、持久性、健壮性、数据冗余、数据完整、数据一致等一系列可靠性的规划和分析,并导入到产品或系统架构设计中,最终在研发阶段完成可靠性能力实现。

例如最常见的云主机,云主机其可靠性需要硬件架构、网络链路层面考虑冗余,故障时能够快速切换和隔离,确保客户业务正常运行。而客户保存在云硬盘上的数据,更是采用三副本跨磁盘、服务器、机柜分布式部署,再通过数据强一致性复制协议,保障副本之间数据一致,使得任意类型节点故障都不会导致数据丢失。

研发管理流程:引入流程,通过流程保障端到端可靠性

可靠性是一个系统工程,除了可靠性为先的设计理念,在研发管理流程上,还通过可靠性部门以及专业人才,制定可靠性规范,从机房、工程组网、互联网出口和云服务软件等端到端的设计系统级可靠性。

 第一,引入潜在失效模式及影响分析FMEA(Failure Mode and Effect Analysis)。FMEA即在产品设计阶段和过程设计阶段,对构成产品的子系统、部件逐一进行分析,找出所有潜在的失效模式,并分析其可能的影响,从而预先采取必要的措施,以提高产品的质量和可靠性,从而确保用户满意的一种系统化活动。FMEA让华为云上产品服务在设计阶段就最大限度消除了潜在的可靠性隐患,确保了各系统、组件之间最有可靠的协同状态,在产品没有发生故障之前就可以提前进行分析,在出现故障之前提前预知,把损失降到最小化。

向上而生,华为云基础设施服务高可靠之路

 第二,建立三线一库:可靠性需求基线、可靠性能力基线、可靠性测试基线和故障模式库。故障模式库是华为基于自身经验与业界故障分析,建立的包括机房、网络、硬件整机和部件、操作系统资源、软件架构、服务之间依赖等多种故障模式。通过故障模式库不断梳理可靠性需求,验证形成可靠性能力基线。同时可靠性测试也不断对故障模式库进行补充,使可靠性建设形成循环,不断演进。

向上而生,华为云基础设施服务高可靠之路

 高质量硬件设备:采用广受市场认可的高可靠硬件底座,无后顾之忧

数据中心、服务器、存储、网络等是公有云的底座,华为云采用的有着严苛的质量要求的自研自产设备,加强华为云的整体可靠性。如服务器生产过程,有元件严选、硬件设计流程、设计创新以及品质检测等多重手段来保障服务器的可靠性。其中元件严选是华为在选择供应商时选择采用TQRDC和ES原则,分别对技术、质量、响应、供货表现、社会责任以及环境保护等方面进行考量,在众多供应商之中选出能满足这些标准的供应商。生产过程中的严格标准,使得服务器质量更加可靠。目前华为服务器全球发货量排名第4、中国市场发货量排名第2(Gartner,2018Q3)。华为存储产品销售到全球150多个国家和地区,4家全球Top 10的银行选择了华为存储,获得了市场的广泛认可。

业务可靠性:依托华为自身实践,帮助客户提升业务可靠性

向上而生,华为云基础设施服务高可靠之路

华为依靠在其自身IT系统可靠性建设和企业级市场的多年历练,积累了大量针对企业场景的可靠性技术和工程实践经验。通过华为云在线云服务的形式提供给客户。华为云率先推出SDRS存储容灾服务,构建同城RPO=0容灾能力,保障数据零丢失。华为云还是首家提供完整公有云灾备解决方案的云厂商,凭借华为17年的容灾实践,提供全栈容灾能力及创新云服务,助力客户以最低改造成本灾备上云,提升客户业务的连续性和稳定性。

不仅如此,基于自身技术能力与经验,华为云帮助某大型互联网客户分析其业务架构,识别出中间件,数据库,NTP使用,DNS使用等5大类21个业务风险点,并提供了解决方案。针对某互联网货运客户,华为云根据客户容灾诉求,细致分析客户的业务系统,结合自身在企业容灾系统构建上的成熟经验,帮助客户快速完成业务系统的跨云容灾设计,并给出长期演进的合理化建议。

可靠:华为云之根

向上而生,华为云基础设施服务高可靠之路

在华为公司官网,有一页专有的质量方针页面,明确阐述了产品质量在华为的地位:质量是华为生存的基石。这就是华为质量基因的体现,基因使然,可靠当然是华为云之根,华为云基础设施服务立根于可靠,通过以可靠性为先的产品设计理念,向上而生,为客户提供稳定可靠、安全可信的云服务与解决方案,助力客户业务持续稳定的高速增长。

高可靠的华为云基础设施服务让华为云敢于向合作伙伴承诺“选择华为云更可靠”、为各行各业的数字化转型升级和智慧城市的打造提供扎实的技术基础,进而助力城市和行业实现创新高质量发展,彼此成就不凡价值。

向上而生,华为云基础设施服务高可靠之路

4月28日,华为云城市峰会2019即将走进吉林,与吉林政企代表和合作伙伴共同探讨如何以“云+智能”赋能吉林城市和行业数字化转型。本次峰会将聚焦工业互联网、汽车制造、软件开发三大方向、深入介绍华为云基础设施服务如何以高可靠性为不同领域客户转型发展提供坚实保障。此外,峰会还将邀请一汽集团等知名企业代表带来“探索数字化转型”的精彩分享。吉林为中国工业发展贡献了非凡力量,如今借助“云+智能”又会创造怎样的不凡未来?期待与你共同见证!

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2019-04-26
向上而生,华为云基础设施服务高可靠之路
著名科学家钱学森说过:”可靠性是设计出来,生产出来的,管理出来的“。公有云的可靠性,一直被人关注,并作为用户选择重要指标。

长按扫码 阅读全文