数据库•开发 频道

去“O”与开源长期并存下,国产数据库如何乘风破浪?

  【IT168 专访】疫情肆虐之下的2020年带来了很多变数,让所有人体会到了“难”。之前数据库领域有人也谈起了去“O”(Oracle数据库)之难,国内提了十多年的去“IOE”,感觉现在对于去“O”依然是蜀道之难,难于上青天。

  Oracle数据库往往承载着企业关键业务系统,去留要看企业发展情况和战略规划,所谓难更多是一种谨慎。“因为’O‘不仅仅是去数据库,还涉及到很多应用,如果过于绝对可能对客户现有的系统产生比较大的影响。”PG中文社区副主席唐成在接受IT168采访时曾说。

  即将到来的5G时代数据井喷,海量数据对数据库提出了新的需求也带来了新的挑战。这两年,去“O”的呼声越来越大,不少传统企业开始脱离“IOE”的集中式架构,进行分布式改造,迈向云端。各个行业也出现了不少成功去“O”的案例,证明国产数据库同样可以支撑企业核心业务系统,让大家对国产数据库的未来增加了一份信心。

十年去“O”远未到尾声

  数据库已经有40多年的发展历史,早期由IOE构建起了封闭的集中式架构体系,以Oracle数据库、SQL Server、DB2为主的商用关系型数据库牢牢占据着企业级数据库市场。

  传统的集中式架构在稳定性和可用性方面有天然的优势,同时缺点也很明显,扩展性差。互联网以及大数据等新技术的发展,海量的数据的爆发使得垂直扩展的集中式架构面临着挑战,可弹性扩展的分布式架构和云端数据库成为数据智能时代的新宠儿。从互联网企业到传统企业,逐渐开始了去“ O”之路,实际上更广泛的说应该是国内企业面向未来依从其战略规划,而进行数据库改造,由于很多都涉及到Oracle数据库,去“O”也可算作调整的代称。

  即便国内去“O”浪潮汹涌,从业者提起Oracle数据库从未吝啬过赞美之情。Oracle 相对其它数据库,功能或者SQL优化器方面遥遥领先,这被视为阻碍去“ O”的难点之一,数据库承载着企业比较重要的业务系统,尤其Oracle往往支撑着企业的核心复杂业务系统,企业替换时会更为谨慎,以Oracle为首的最早几家霸主至今依然占据着关系型数据库市场的统治地位。

  在新基建的东风下,像TBase这样的国产数据库产品正乘风破浪。TBase是由腾讯数据平台团队基于PostgreSQL 自主研发的企业级分布式HTAP关系型数据库,作为腾讯云三大自研数据库之一,采用Share-Nothing架构,集高扩展性、高SQL兼容度、分布式事务支持、多级容灾能力以及多维度资源隔离等能力于一身。TBase可适用于拥有海量数据、高并发、高吞吐,以及混合HTAP、要求分布式事务能力的各种应用场景。

  “有些客户(去“O”)的需求特别高,不过毕竟Oracle也是老牌数据库,所以要跨出去这一步还是很不容易的。” 10多年前曾在研究所参与核高基数据库研究的腾讯云TBase产品负责人黄琳认为国内真正去“O”大幕才刚刚拉开,“我一直都有一颗做强国产数据库的心”。

  Oracle兼容性是衡量国产数据库产品的一项重要指标,也是国内企业的重要关注点之一,

  “很多人也会说,做Oracle(兼容)是无底洞,一直在投入,就是做永远也做不完。”黄琳如此介绍Oracle功能的强大,目前TBase Oracle兼容性度较高,支持标准的SQL2003标准,且具备分布式存储过程、视图、触发器等全面的SQL能力,在企业不愿意对之前基于Oracle的业务进行大量改造的场景,TBase将是不错的选择。针对Oracle的兼容性问题,TBase的解决思路是优先从通用基础能力入手,结合客户实际需求去逐步完善Oracle兼容性,现在已经做了近千项语法兼容。

  值得一提的是,TBase是基于PostgreSQL生态的数据库,既有集中式形态也有分布式形态。黄琳认为分布式架构和云虽然是未来大势所趋,但是现在集中式场景还比较普遍存在,比如某些小企业或者业务比较单一的企业数据量不太高,并发需求不太明显,传统集中式OLTP可以胜任,团队会推荐集中式版本,“不一定要走分布式这条路,因为分布式节点之间的这种协同,网络开销会有一定损耗。而对于海量数据使得单点存储空间不足,高并发单机不能消化掉,客户对未来数据增长有预期,那么分布式高扩展这种能力都是有非常大的优势,这时候我们会推荐客户用分布式架构。”她强调分布式并不会通吃所有场景,集中式和分布式这两条线会长期演进下去,企业要结合自己的业务和公司战略综合衡量再做决定。

  为了满足企业的数据库调整需求,未来TBase会不断强化Oracle兼容性,腾讯云也会不断完善数据迁移工具等,比如6月18日,腾讯云外发布了企业级数据库迁移产品DBbridge,通过提供一站式数据迁移平台以及专家服务,帮助企业实现异构数据库之间数据的迁移和同步。尤其在传统数据库迁移到分布式数据库场景下,DBbridge能够有效降低数据迁移的成本和复杂性,满足企业多样化的数据传输、数据汇聚、数据灾备等需求。

  而日前TBase进行了开源后首次重磅升级,发布了最新开源版本,也引起了业内对数据库开源问题的关注。

用开源探索数据库未来

  开源数据库的发展改变了数据库市场,成为重要的力量。根据2018年Gartner发布的相关报告,到2019年,OSDBMS(开源数据库管理系统)在DBMS(数据库管理系统)市场中的总支出份额超过10%以上,到2022年,超过70%的企业内用应用将会基于OSDBMS,50%的现有商业关系型数据库系统将会被替换掉,或者正在计划被替换掉。

  而从2018年开始,Redis Lab、MongoDB、Neo4j等多家开源数据库修改许可协议,这被认为是开源数据库阻止商业公司继续吸血的举动,开源数据库似乎变了天。“这确实对整个开源界释放出一个新的信号,也就是开源除了精神上的支柱,其实也需要商业化的支柱。可能商业化反而会助推其开源的发展。因为像MongoDB这样的公司,其实还是需要商业回报,才能去推动开源的发展,其实这个趋势现在是非常非常明显的。”PostgreSQL中文社区主席赵振平在之前接受IT168采访时指出。

  开源数据库修改许可协议更多是基于商业方面的考量,而开源依然是对数据库发展非常有益的商业模式探索,实际上国内外开发者对开源数据库生态的热情并没有减少,国内厂商也在积极拥抱开源。

  去年11月TBase宣布开源,今年6月,华为也正式宣布开放openGauss数据库源代码。二者皆是基于基于PostgreSQL开发,团队都坚持要来自开源回馈开源,不过二者开源有所不同,TBase开源的是分布式版本,openGauss开源的只是单机版本。根据相关专家介绍PostgreSQL因其开放性和完善的生态,越来越受欢迎。而在过去的几年中,PostgreSQL出现了大规模的普及和增长,DB-Engines显示其受欢迎度在过去四年中翻了一番。

  相对于商业数据库,开源生态更为开放,很多数据库从业者都积极参与其中,企业选择开源数据库也有自己的考量,“TBase有开源,我懂PG,我就容易懂你(TBase),会上手很快。”不少客户都会对TBase团队分享他们对开源的看重,黄琳介绍TBase开源生态的一个主要优势就是不绑架客户,客户的正向反馈也给了团队拥抱开源的决心和信心。

  7月13日,TBase发布了最新开源版本,该版本在多活分布式能力、性能、安全性、可维护性等多个关键领域得到全面的增强和升级,复杂查询的性能提升十倍以上。截止目前,TBase在GitHub上的Star数已超过800个,Fork数近200。

  据腾讯云TBase数据库技术负责人李跃森介绍,最新发布的TBase开源版本具备强大的多活分布式能力,并提供了发布与订阅层面一系列的新特性,可以帮助用户更高效地完成数据同步和快速定位错误。TBase开源新版本还采用全新的备机升主方式,新增了插件在线升级、锁优化等多项新功能。未来TBase会继续拥抱PostgreSQL生态,全面支持PostgreSQL上下游生态。“希望TBase成长为一个受欢迎、有能力、有担当的一个国产数据库品牌,为更多的客户服务。”黄琳说。据悉,TBase不仅在微信支付这类重要的内部业务中经受了单日请求量超10亿次的考验,也成功应用到政务、医疗、公安、消防、电信、金融等诸多行业的核心业务系统中。

  越来越多的国内数据库产品选择开源,证明国产数据库已经有了可以走向世界的技术能力,将会为开源生态贡献自己的经验和力量,而不断壮大的开源社区也会助力厂商数据库产品不断完善,这是一个持续正向增长的过程。不过目前中国开源数据库生态相比与国外还有一定的差距,还在一个探索的阶段。

  可以预见去“O”与开源仍然是接下来数据库领域的重头戏,大幕拉开,百花齐放。

3
相关文章