数据库 频道

OceanBase越来越能打了

  【IT168 评论】我一直不赞成中国数据库“弯道超车”的说法。

  在集中式数据库或者说单机数据库赛道,中国数据库要超越Oracle,几乎没有可能。在这条赛道上,中国数据库就像是一个刚拿到驾照的新手,说要在赛道中的弯道部分超越前方Oracle这种F1级别赛车手,显然不符合实际,至少短期内是没有可能。

  中国数据库赶超的机会在于“换道超车”,这与汽车领域有异曲同工之妙,如果说,中国汽车在燃油车赛道要超越国外,短期内也是不可能的,反而,切换下赛道,在新能源车赛道,中国新能源汽车实现了领跑。

  在我看来,分布式数据库就是数据库领域的新能源车,这是一条新赛道。所以,有着巨大的空间和无限的可能,但也正因如此,分布式数据库产品成熟度仍需时间沉淀,这是客观事实。新能源车亦是如此,虽然大势所趋,但目前至少在使用上,还有很多问题需要解决,比如:里程焦虑,充电费时、充电设施不足等。产品成熟度并非一跃而就,是必须要经历的过程,关键在于能不能有突破式创新,去解决短板,从而实现广泛应用,这才会有机会实现领跑。

  必须强调,数据库的替换不仅是一个产品的替换,替换的目的不应单纯为了“国产”两个字,替换后的新系统必须具备老系统和国外产品不具备的能力。正如我曾经采访某银行时,其数据库负责人所提到的:“如果你要向我推销数据库产品,你得给我讲清楚几件事,我为什么要买你?如果说你的产品是为了顶掉我当前用得好好的产品,你得告诉我,凭什么?”

  以前的文章中,我已探讨过,分布式数据库并非中国特色而是全球趋势。抛开政策面不谈,就需求面说,分布式数据库有2方面的强需求支撑,其一,数据鼓励升级,面对数据量的大幅增长,传统数据库性能瓶颈凸显,用户选择呈现出从集中式数据库向分布式数据库转移的趋势。其二,中国独有场景倒逼创新,众所周知,中国庞大的人口基数导致信息终端规模和数据体量在全球绝对领先,这就导致中国的信息系统面临世界级压力,分布式数据库应运而生,这就是为什么企业都在关注分布式数据库的原因。

  很多人认为阿里巴巴“去IOE”是政治因素,我不这样认为,早期的互联网公司不仅是Oracle客户,还都是大客户,最典型的代表,国外有亚马逊、国内有阿里巴巴,但是,两者最后都纷纷去掉了O,可见并不是什么政治因素。

  OceanBase,就是在此背景下诞生。2017年,走出蚂蚁集团,对外商用。2019-2020年,OceanBase 两次打破TPC纪录。2020年6月,OceanBase注册独立公司“北京奥星贝斯科技有限公司”,独立运作,商业化按下加速键。2021年6月1日,OceanBase 正式开源。

  毫无疑问,在分布式数据库赛道中, OceanBase是热门种子选手之一,而最近,其又有重大突破。

  8月10日,OceanBase 4.0正式发布,区别于以往大版本发布,此次4.0还有个特别的版本代号“小鱼”,足以说明这个版本的不同。到底有什么不同?背后有怎样的技术创新和突破?

  

  会上,在与多位OceanBase内部人士沟通后,我总结了以下6个要点:

  1、 OceanBase 4.0不仅可运行在最小电脑树莓派开发板上,还在其上顺利运行Wordpress博客程序。其单机部署并不损失功能,具备完整功能。

  2、 OceanBase 4.0单机部署同等硬件条件下,性能超越MySQL,官方提供数据显示,96c场景下update_non_index case,MySQL 8.0峰值TPS 32w,OceanBase 4.0峰值TPS 51w。

  3、 OceanBase 4.0在保证数据的一致性的前提下,具备“一库多芯”混合部署能力,国产化浪潮下,国产化混合部署是企业关注的热门话题。官方信息显示,OceanBase可以同时在 Intel、海光、鲲鹏3种不同芯片环境上运行。

  4、 OceanBase 4.0将故障恢复时间从分钟级(30s)降低到秒级(8s),据了解,8s并非最优状态下的数据,也非平均值,而是一个最保守值,意味着还有余力。

  5、 OceanBase Cloud全球开服,支持多云部署,目前已经适配主流云厂商,分别包括阿里云、AWS、谷歌云、华为云、腾讯云等。据了解,后续将支持全球主流公有云基础设施。在过去一年的年营收,实现同比300%的增长。

  6、 此次发布会,OceanBase CTO杨传辉没有露面,去哪了?在美国,正在筹备OceanBase第一次北美Meetup,而OceanBase CEO杨冰告诉我,近期也会过去。

  那么,问题来了,套用知乎上最流行的提问方式,这些都意味着什么?

  先说结论再分析。

  对OceanBase意味着什么?

  意味着OceanBase突破了“分布式数据库”的边界,向“通用性”数据库又迈进了一步,具备支持用户从小到大的业务规模化增长能力。

  意味着OceanBase是独立第三方数据库厂商,具有中立优势,能提供跨云,可在任何云上甚至不在云上。

  意味着OceanBase国际化又迈出了重要的一步。

  对行业意味着什么?

  意味着,中国数据库在技术上突破了分布式数据库单机性能瓶颈,实现了单机性能赶超集中式数据库的行业历史突破,这是一个里程碑事件。

  众所周知,分布式的核心定义就是几台机器共同完成一个任务,所以,分布式数据库从诞生的那一刻起,就是三副本,需要多台机器部署。因此,分布式数据库就比较“大”,部署门槛比较高,这无疑会让很多用户“望洋兴叹”。此次OceanBase“单机分布式一体化”,打破了分布式数据库部署高门槛,可实现单机部署,单机可平滑扩容到多机,多机亦可平滑缩容到单机,可扩可缩。这意味着分布式数据库从此以后也可以像单机数据库一样使用,并且性能、功能不损失。这很重要,对于企业业务,如果单机数据库就可以搞定,谁会换成分布式呢?所以说,OceanBase突破了“分布式数据库”的边界,让分布式数据库向“通用性”数据库又迈进了一步。

  这其中有个关键点,“单机分布式一体化架构”,怎么理解?去年,我采访OceanBase CTO 杨传辉的文章中,其实有过详细介绍。

  所谓,“一体化”架构可以理解为OceanBase是一个数据库,却兼顾多种数据库的优势,如:具备分布式数据库的扩展性与集中式数据库的单机性能优势,一套引擎同时支持OLTP和OLAP的混合负载(HTAP),还具备数据强一致、高可用,高度兼容 Oracle/MySQL等特征。简单的说,以前企业需要安装多种数据库才能解决的问题,如今只需要装1个OceanBase就能解决。

  “把简单留给用户,把复杂留给数据库”这是OceanBase CEO 杨冰接受采访时常说的一句话。其意思是说,数据库问题应该用数据库来解决,而不是通过非数据库的方式(如:中间件、分布式系统)来解决。这样不仅会给用户带来麻烦,并且也有其短板。

  比如“分布式中间件+单机数据库”路线是在单机数据库系统上进行改造,主要解决了扩展性的问题。但由于分库分表,业务代码也要相应修改,改造成本高,还有这种路线往往只能扩容很难缩容。再如:通过构建分布式共享存储实现扩展,采用非对称计算节点(大部分公有云数据库)是这条路线,其本质上也是一个分布式系统,而非一个分布式数据库,所以,扩展性有限,尤其是写节点,当数据处理规模要求较高时,仍旧需要分库处理,并且很难做到跨地域高可用。

  OceanBase在技术上,突破了分布式数据库单机性能瓶颈,实现了单机性能赶超集中式数据库的行业历史突破,是分布式数据库里程碑里重要的一步。

  单机性能实现突破后,对用户意味着什么?首先,是降低成本。OceanBase变小了,客户成本大幅降低。中小企业可以以更少的成本享受分布式数据库的高性能。其次,是灵活。企业可以根据发展情况,随时增加机器,也可以随时减少机器,不再担心,分布式曾经的单机性能问题。

  RTO < 8s,意味着什么?很多人对RTO的了解可能停留在PPT层面,往往遇到故障时才能真切感受到其重要性。最近,阿里云刘伟光的一篇文章《超大型金融机构国产数据库全面迁移实践及经验》恰巧提及了一个这方面的案例。

  这就是RTO < 8s的意义。RTO数值越小,代表容灾系统的数据恢复能力越强,很多人可能不知道,2014年,业内第一个RTO < 30s新标准是 OceanBase提出的。2022年,业内的第一个RTO<8s在 OceanBase 4.0实现,OceanBase引领故障恢复真正进入秒级时代。

  那么,技术突破对中国数据库到底意味着什么?正如本文开头所述,中国数据库,在集中式数据库赛道落后于欧美,靠分布式“换道超车”, 而OceanBase 4.0真正实现单机性能比肩集中式,这意味着中国数据库在追赶欧美数据库的步伐上实现了关键一步。

  “你敢用,我敢赔”是此次OceanBase 年度发布会上提出的一个口号,也是在过去发布会上没有的,可见OceanBase的自信,OceanBase真的越来越能打了!

0
相关文章