极客网·极客观察(朱飞)1月7日 数据库被称为软件行业“皇冠上的明珠”,软件行业中的“重工业”,产业一举一动扣人心弦。尤其是在数字经济高速发展、数字中国建设如火如荼的今天,数据库作为支撑各行各业数字化转型、开展数字业务的核心生产要素,如何承接新一代信息技术与千行百业数字化转型深度融合大机遇,同时打破长期存在的“卡脖子”困局,为我国数字经济高质量发展构筑高性能、安全可靠、自主可控的核心基础设施,意义重大而深远。
12月28日,以“汇聚数据库创新力量 逐梦数字时代星辰大海”为主题的openGauss Summit 2021在北京线上线下同步举办,引发社会各界广泛关注。峰会期间,极客网对话了中国唯一以数据库为主营业务的主板上市公司、openGauss社区理事会理事单位之一的海量数据总裁肖枫,听他分享了新时代下国产数据库面临的机遇和挑战,以及海量数据的路径选择和实践经验。
海量数据总裁肖枫
国内数据库产业从混沌走向清晰,从观望走向坚定
在数据库领域拥有22年从业经验的肖枫告诉我们,国产数据库经历探索仿制、国外商业数据库授权、国外开源软件封装、面向企业级应用重构,已逐渐从混沌走向清晰,从观望走向坚定。
一方面,国产数据库的技术路线、开源协议、体系演进都在逐渐明晰。首先,过往对数据库开源软件的协议风险认识不充分,现在越来越多的从业者认识到MySQL采用的GPL开源协议是“悬在头上的达摩克斯之剑”,更加重视潜在风险;其次,过去数据库更多是单打独斗,没有与CPU、操作系统、ISV生态软硬结合去做体系化演进,现在更加注重软硬件生态协同发力。
另一方面,国内对数据库自主研发及技术演进能力从忽视走向重视。过去国内没有认识到数据库领域自主研发的必要性和技术攻关压力,但现在意识到必须要有自主研发及技术演进的能力,基于自己的处理器进行原生开发,构筑CPU、操作系统、数据库体系化的技术竞争力,加快实现国产数据库从非生产系统到核心生产系统的部署演进。
海量数据从成立之初起就一直专注做数据库,2014年开始基于PostgreSQL开发第一代产品,2020年开始基于openGauss开发第二代产品,并紧随openGauss内核升级而逐步迭代。肖枫强调,海量数据选择openGauss正是基于对数据库产业的判断。
首先,openGauss采用了国产开源协议-木兰宽松许可证 v2,允许所有社区参与者对代码进行自由修改、使用和引用,非常友好。而且其源代码放在中国,获取非常方便。相比之下,MySQL采用的GPL协议具备传染性,存在分发风险,同时受美国EAR(出口管制条例)管制,存在很大不确定性。另外一个主流开源数据库PostgreSQL虽然协议友好,但实际上也会受EAR管制,同样存在修改开源协议所带来的使用风险。
其次,openGauss具备企业级数据库的创新能力,可以真正实现科技自立自强。openGauss直接基于企业级能力的开源协作,将华为在数据库领域20多年来已经构筑的企业级能力积累向产业界开放,能够面向数字基础设施提供安全、稳定、高效、智能的数据管理能力。
再次,openGauss已经支持多样性算力,在鲲鹏、X86等不同硬件平台上均表现出色,尤其在鲲鹏计算平台上,因为技术根源于华为,与鲲鹏、欧拉的结合构成软硬协同的独特竞争力,再加上ISV(Independent software vendor,独立软件开发商),整体打造出基于鲲鹏计算平台的充满活力的生态。
依托多年技术积累,海量数据融入openGauss生态乘风破浪
选择openGauss技术路线后,海量数据依托自身多年的技术积累发布了商业发行版Vastbase G100。该产品兼具极致性能与高兼容、高可用、高安全、多引擎、高并发等多种特性,发布以来已在多个行业头部客户得到部署应用,包括制造行业的比亚迪新能源、中芯国际,金融行业的中信证券、国泰君安,政务领域的深圳政务云、广州政数局及大连市政府大数据中心等。
谈及Vastbase G100的成功之道,肖枫认为一方面源于多年技术沉淀,融入openGauss后做了大量企业级数据库的兼容适配;另一方面是深入融合鲲鹏计算产业生态,全栈优化,体系化演进。
首先,海量数据库Vastbase G100在原有功能基础上增加了大量企业级数据库的兼容特征,各方面功能均实现了对Oracle、MySQL等主流企业级商用数据库的高度兼容,并配套了一键式异构数据库迁移平台exBase,集成业内领先的数据库迁移能力,能够大幅降低业务系统的迁移、改造成本。
其次,海量数据联合鲲鹏计算产业生态中的硬件整机伙伴、操作系统、中间件等产业上下游企业基于openGauss技术路线进行深度优化,把openGauss在NUMA-Aware技术、SQL-Bypass、锁拆分、增量检查点、CSN事务快照等方面的核心技术最大程度上释放出来,在兼容性、安全性、性能、伙伴的适配性方面都有显著提升。
令人印象深刻的是,在多个场景应用中,海量数据库产品是与鲲鹏生态中的硬件、操作系统、中间件等通过软硬件协同优化,实现整体性能全面提升,体系化演进带来的共赢效应十分显著。对此肖枫直言,“体系化、全栈演进是趋势。处理器、操作系统、数据库这三大件,天生就具有捆绑效应。比如Wintel联盟,IBM的Power处理器和数据库,Oracle与其收购的SUN,本质上都是体系化的方案。体系化的方案可以做很多底层的深度优化,长期来看可以带来更稳定的收益。”
打破“缺芯少魂”,需要构建人才和生态的正循环
长期以来,我国“缺芯少魂”不仅仅是技术和产品本身的问题,更重要的是缺乏相应的生态和人才支持。肖枫认为数据库人才的发展和生态的构建是正循环,一方面培育人才提升产品竞争力,一方面通过更多真实市场需求检验产品,在人才和生态不断“拧麻花”的过程中向上发展。
这意味着,国内数据库领域需要把一根根手指握成拳头,凝聚成几个有竞争力的生态。openGauss正是这样一个有生命力、有前景的生态,能够汇聚数据库人才和产业链各方,形成人才的聚集地,创新的聚集地,达到人才与生态之间的同步促进,实现长期良性发展。
资料显示,openGauss自开源以来便积极进行人才培养和生态建设。在人才培养方面不仅打造系列技术课程解剖openGauss底层技术,推出相关数据库认证,培养高质量数据库人才,还积极开展产教融合,通过“智能基座”项目与72所高校合作出版教材教辅、展开数据库培训,厚植人才基础。在生态建设方面构建了由数据库厂商、关键行业客户、高校学术机构组成并不断升级的 openGauss 开源社区理事会、技术委员会等,推动产、学、研、用融合发展,打通人才体系建设,通过基础理论对接产业和市场需求构建知识体系,激发产业持续活力。
肖枫强调,通过生态收敛,技术创新,商业效益,人才聚集,用户认可,进而实现产品不断提升,是解决我国数据库产业面临的人才和生态问题之道。海量数据正在加大人才引进、高效率培养人才,打造有厚度的数据库人才梯队,深度参与openGauss社区建设,坚定融入并一起发展壮大openGauss生态。
建设社区夯实生态,携手逐梦数字时代星辰大海
开源为软件生态构建提供了更快更优的实现路径,而开源社区建设将决定生态的活力与前景。openGauss秉承“共建、共享、共治”的理念,搭建了由理事会、技术委员会、秘书处构成,通过开放、成熟的治理,与企业、伙伴、开发者,共同建设的最具创新力的开源社区。数据显示,在开源以来短短一年半左右的时间里,openGauss社区已吸引了产业链100家核心企业的加入,覆盖政府、金融、运营商、能源、制造等行业;发展了20个SIG特别兴趣小组;超过2500名开发者参与技术贡献;全球下载量超过50万,遍布全球81个国家,558个城市……
在这个过程中,海量数据也第一时间与openGauss社区全方位合作。2020年9月25日,openGauss社区理事会正式成立时,参与前期筹划的海量数据成为首批18家理事单位之一,共同参与社区治理,推动社区生态建设。2021年12月28日,openGauss社区技术委员会升级,海量数据专家入选新的技术委员会委员,共同开展技术创新,持续构建技术竞争力。同日,openGauss社区分委会成立,海量数据成为首批共建单位,携手促进高校师生走进开源社区,加速成长为数据库产业人才……
据肖枫介绍,在深度参与openGauss社区建设中,海量数据在源码贡献和非代码贡献方面均有大量涉及,包括代码提交、Bug修复、新特性,缺陷提交、产品改进需求等,整体社区贡献仅次于华为,获得2021年openGauss最佳实践伙伴。接下来希望增加对社区的深层贡献,比如加强对产品缺陷的管理和修复、研发更贴近用户需求的功能和特性等,争取为社区贡献更大的价值密度,同时也提升海量数据自己的能力。
面向未来他表示,海量数据作为openGauss社区理事会首批单位之一,愿与社区、伙伴、用户一起努力,培育更多的openGauss人才,打造最好的企业级数据库!沿着客户的需求走,使openGauss社区生态发展更加壮大、更加完善,并与上下游伙伴携手并进,一起为数字新时代建设跑出“加速度”,逐梦数字时代的星辰大海。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。