数据库 频道

黑马openGauss,能否一黑到底?

  “我们期望,openGauss能成为各行各业数据库的首选技术路线”, openGauss社区理事长江大勇对老鱼说。

  作为一个开源仅一年半的数据库新项目,这话咋一听,似乎心比天高。其实不然,江大勇这话是有底气的。

  openGauss开源于2020年6月30日,并发布了首个社区版本,目前,已经迭代发布三个版本,下一个Release 3.0版本将在2022年3月正式发布。

  自从开源以来,openGauss的排名就一路高歌猛进,迅速攀升至国产数据库流行度排行榜第二名,仅次于TiDB。(数据参考:墨天轮国产数据库流行度排行榜)。要知道TiDB可是开源了6年多(2015年9月开源),openGauss无疑是今年国产数据库中最大的黑马,这匹黑马未来能否一黑到底?

  近日,在openGauss summit 2021大会上,老鱼有幸采访到了openGauss开源社区理事长江大勇、openGauss技术委员会主席、清华大学计算机系副主任李国良。就数据库重要性,华为为什么要开源openGauss?openGauss开源社区的进展、治理模式、活跃度?openGauss的技术创新和独特优势?openGauss的应用场景和商用情况?进行了充分交流。

  数据库重要性

  软件是新一代信息技术的灵魂,是数字经济发展的基础。数据库是信息技术的核心基础软件,所有应用软件的运行和数据处理都要与其进行数据交互,所以,数据库是计算产业的根技术,其重要性也就不言而喻。

  数据库毕竟过于专业,大部分人并没有什么概念,因为数据库不像手机,不是每个人都可以直接接触到的。但每个人的日常生活中,其实都在享受数据库带来的便利。

  如果没有数据库,就没有手机、微信、抖音、淘宝、王者荣耀等一切应用和网站,如果没有数据库,你在ATM机上取不到钱,手机上也转不了账,12306上也订不了火车票。

  曾经有新闻报道,程序员“删库跑路”,一己之力蒸发公司市值超过10亿,300万商铺遭瘫痪。数据库重要性可见一斑。

  华为为什么要开源openGauss?

  华为为什么要开源openGauss,其实老鱼在以前的文章中有过论述,回答这个问题,本质是要回答2个问题:

  1、 华为为什么要做数据库?

  2、 华为为什么要开源openGauss?

  华为做数据库主要是自身业务需求,华为研发数据库历史最早可追溯到20年前,也就是2001年,源自运营商业务需求。华为有超过20年的数据库研发积累,支撑公司内部40多个主力产品,在全球70多个运营商规模商用数十万套。

  华为为什么要开源openGauss并创建openGauss开源社区,图什么?江大勇告诉老鱼,数据库是基础软件皇冠上的明珠,也是国内基础软件发展的最大挑战。做数据库都知道,如果独立研发内核,开发周期长、人力投入大、需要长期坚持投入。而如果采用常见的开源数据库,在性能、可靠性、安全性等方面,又离企业级要求有较大差距。

  中国这么多年来无数组织和团队分别投入了很多资源,但到目前为止没有特别成功的,所以,华为将在数据库领域多年来已经构筑的企业级能力积累,通过开源的方式向产业界开放,以此为基础来构建生态,是数据库产业能够高效、稳健发展的有效模式。

  江大勇指出,openGauss的策略是聚焦打造“高性能、高可靠、高安全、高智能”的数据库内核,并支持合作伙伴完善企业级特性,来实现稳步的商用。

  截止到目前,华为开源openGauss,得到了产业各界伙伴们的积极响应和支持,推动技术、生态、商业协同快速发展,全面激发了产业链的活力。

  openGauss开源社区进展、治理模式、活跃度如何?

  短短一年半时间,openGauss就能攀升至国产数据库流行度排行榜第二位,这与社区运营,治理模式及活跃度密不可分。

  江大勇给老鱼展示了一组数据,开源一年半以来,openGauss社区已吸引了产业链100家核心企业的加入,覆盖政府、金融、运营商、能源、制造等行业,发展20个SIG特别兴趣小组,超过2500名开发者参与技术贡献;全球下载量超过50万,遍布全球81个国家,558个城市。

  江大勇特别强调,openGauss社区秉承“共建、共享、共治”的理念,与全行业伙伴、用户、研究机构一起,构建繁荣的数据库生态,共建领先的数据库。

  openGauss开源社区由理事会、技术委员会、秘书处构成,通过开放、成熟的治理,与企业、伙伴、开发者,共同建设最具创新力的开源社区。

  江大勇表示,本次大会,openGauss社区理事会和技术委员会都进行了升级,社区理事会由18家单位增至20家,由7家公司16名数据库技术专家组建了新的技术委员会,并成立社区分委会,以完善社区治理,激发社区活力。

  在人才培养方面,在72所高校展开了数据库培训;已经出版了《openGauss数据库核心技术》《openGauss数据库源码解析》《openGauss数据库实战指南》等教辅。

  openGauss的技术创新和独特优势?

  技术是数据库的核心竞争力,开源数据库优势之一就是技术路线图明确。openGauss未来2-3年技术路线是怎样的?有哪些技术创新、特性和独特优势?

  据李国良介绍,openGauss将不断扩展数据库应用场景、完善工具和丰富行业解决方案,来打造一个繁荣的openGauss生态体系。openGauss社区将长期、持续地聚焦内核创新能力,围绕“高性能、高可靠、高安全和高智能”提升openGauss的技术竞争力;同时还将协同伙伴、高校实现对图、KV、时序的支持,通过开放的技术架构,不断完善工具与组件,助力客户和伙伴打造企业级的产业与服务能力,联合伙伴和用户,构建丰富的解决方案并落地行业客户。

  基于openGauss技术路线,提供社区发行版、商业发行版、企业自用版、以及云服务,满足用户的各种需求和服务。

  李国良表示,未来2-3年的技术路线, openGauss社区聚焦打造数据库根技术、持续围绕四大创新做内核能力创新,并通过“软硬协同、智能优化、交叉融合、安全可信” 四轮驱动,引领数据库内核技术创新。openGauss有很多创新成果,也是其独特技术优势所在。

  例如:在高性能方面,openGauss 的性能对比当前主流开源数据库均大幅领先,openGauss社区版能够测到180-200万 tpmC,商业发行版测出来四路服务器250万tpmC。在高可用方面,openGauss 的RTO(Recovery Time Objective,复原时间目标)是业界最短的,另外今年首创RPO(Recovery Point Objective,数据恢复点目标)为零的数据库同城双集群高可用方案也是国内首创能力。在高安全方面,openGauss 在全密态是走在前列的。在高智能方面,openGauss 利用 AI 进行智能参数调优和索引推荐,可减少 85% 的传统索引,且索引的推荐准确率达 90%。

  技术创新有几个数据可以看,李国良指出,一是专利,二是论文,墨天轮显示,与openGauss相关的专利有445个,论文36篇(全部发布在数据库三大顶级会议上)。

  内核之外,则与合作伙伴一起来做,技术创新是openGauss社区保持活力的驱动力。李国良说,目前社区吸引到100家企业加入,超过2500位开发者参与技术贡献。

  openGauss社区将致力于打造技术创新的孵化器。社区中汇聚了数据库厂商、企业用户、开发者、高校和研究机构等力量。例如,本次大会,中国电信发布行业首个云原生关系型数据库TeleDB for openGauss。中国联通启动基于openGauss的数据库自主创新(CUDB)。中国移动正在实施OLTP数据库联合创新项目。

  openGauss的应用场景和商用情况?

  在谈到openGauss的应用场景和商用情况时,江大勇介绍,目前,海量数据、云和恩墨、神州通用、超图等多家伙伴基于openGauss推出了商业发行版,2021年,在金融、政府、电信、能源、制造等行业推广使用一万套。openGauss 的产品级开源能力和特性得到了充分的验证。

  例如,中国邮储:邮储银行新一代个人业务核心系统的国际汇款业务上线运行,依托企业级开源数据库openGauss,新核心系统的整体性能提升了100%。

  在访谈中,江大勇提到,“中国正逐渐从使用开源向贡献开源在转变,随着国内对软件的认可度的增加,未来数据库市场规模至少是现在几倍的规模,甚至十倍以上。“

  江大勇特别强调,数据库技术是需要长期投入的产业,技术创新是openGauss立足之本,生态构建是openGauss能否繁荣的关键,在商业推广方面用户开放场景是对openGauss最大的支持和肯定,开源建设和人才发展是创新的源泉,技术、生态、商业,开源建设和人才发展五大因素协同,共同打造数据库根社区。

  “单丝不成线,独木不成林",逐渐已成规模的合作伙伴正在为openGauss打造一个坚实的生态壁垒,源源不断的场景和需求将驱动openGauss在未来走得更远。

  openGauss能否成为各行各业数据库的首选技术路线,我们拭目以待!

0