数据库 频道

“路选对了就不怕远”,OceanBase“大胆”地开源

  6月1日,在数据库OceanBase3.0峰会上,OceanBase推出了3.0版本,OceanBase 3.0升级为一款支持 HTAP 混合负载的企业级分布式数据库,并晒出了独立一周年后亮眼的成绩单。业内普遍关注的开源之事也终于靴子落地,OceanBase 宣布正式开源,并成立 OceanBase 开源社区,社区官网同步上线。

  最近国内数据库市场大事不断,拥抱开源之势更浓。此次OceanBase的开源有何不同?OceanBase经过10多年研发,打榜TPC-C、TPC-H打破记录证明自研分布式数据库能力,并获得工行、中国移动等标杆客户,将要迎来商业化飞速发展的OceanBase为什么选择了开源?

OceanBase“大胆”开源

  有业内人士指出此次OceanBase开源有诚意也很“大胆”。

  据了解,开发者在开源社区能够完整使用 OceanBase 数据库内核。此次开源采用业界通用 Open Core 模式。开源范围包含数据库内核、分布式组件和接口驱动,并提供完整的 SQL 引擎、事务引擎和存储引擎,支持多副本、分布式事务、高性能、扩展能力、故障恢复、优化器、多活容灾、语法兼容等核心技术,开源300万行核心代码。此外,成立 OceanBase 开源社区,社区同时成立了技术委员会,社区官网(https://open.oceanbase.com/)也同步上线。

  OceanBase 采用木兰公共协议 MulanPubL-2.0 版,代码托管主站选择了中国独立的开源托管平台Gitee,镜像托管在GitHub上。

  从开源的范围来看,并非外界所传的阉割版,是数据库内核等全面开源,展示出了OceanBase开源的诚意与决心,社区官网、开源社区以及技术委员会等体系化的建设也表明此次开源绝非一时兴起,此次峰会上,OceanBase CEO杨冰介绍了OceanBase开源社区发展规划,在人才、用户、开发者方面有清晰详尽的计划。

  据悉,开源已经上升为 OceanBase 重要的技术战略,OceanBase 数据库创始人阳振坤表示,蚂蚁自研数据库 OceanBase 致力于打造企业级开源数据库,同时与合作伙伴一起紧密合作,快速发行商业版本,满足行业客户对数据库高性能、高可靠、融合处理的业务诉求。

  在开源协议选取方面则体现了OceanBase“大胆”的一面。开源社区有大量的开源许可证,大体可以分为两大类,宽松型如MIT、BSD、Apache Licence等,鼓励代码共享和尊重原作者的著作权,允许代码修改和再发布,可做商用。另一类传染型许可证如GPL、AGPL等,有一定的限制,不允许修改后和衍生的代码作为闭源的商业软件发布和销售。

  为了开源社区的快速发展,很多开源项目选择了宽松型许可协议。OceanBase选择的木兰公共协议 MulanPubL-2.0 版属于传染型,对开源软件的分发条件有限制性要求,对云计算和SaaS等新兴技术的分发也有条件限制。

  北大计算机系教授、木兰开源许可证主要发起人周明辉表示,开源社区选择MulanPubL类许可证一般是为了保障工业主流体系的稳定。杨冰承认选择MulanPubL-2.0这样较为严格的许可证在社区短期推广方面有一定的限制,OceanBase希望更多力量聚集到一个社区,选择MulanPubL-2.0可以限制分裂,利于社区长期发展。

  最近几年不少开源数据库收缩了许可协议,而Elastic与AWS的纷争和官司也殷鉴不远。OceanBase开源,有自己长远的规划,也展开了新的篇章。

OceanBase为什么开源?

  一直以来,OceanBase坚持自主研发,从2010年开始立项到现在,历经阿里巴巴和蚂蚁集团大规模业务场景的长时间考验。从2017年开始,OceanBase 的技术服务对外输出,覆盖金融、交通、通信、能源、公共事务等领域,获得了工行、中国移动等头部客户的认可,打榜TPC-C,在权威第三方证明分布式数据库技术路线的正确性,国产数据库有能力跻身世界顶级数据库行列。

  2020年6月1日,OceanBase注册独立公司,迈上新征程,刚刚过去的2020年也是OceanBase的商业化元年,OceanBase为什么选择开源?

  开源的发展已经有20多年的历史,开放、平等、协作、共享的开源模式逐渐成为新一代软件开发模式。此前OceanBase 曾在2013年开源0.4版本,后由于版本不成熟等多方面原因搁置下来。

  杨冰在采访时指出,上一次开源更多是技术性开源,由于版本不成熟以及技术支撑等准备不充分后面没有再维护,但上次开源也取得了一些成果,与高校教授等做了沟通。此次开源更多是基于三个方面考虑:

  一是,数据库作为软件皇冠上的明珠,对上承接大量业务系统,下接操作系统、芯片等复杂基础设施,数据库这样的基础软件想要更好的发展需要开放,OceanBase独立公司运营,面临着更多场景和上下游技术生态的连接,开放开源可以更快与各方生态对接。

  二是,数据库是一个复杂的系统工程,希望通过开源社区借助于更多人的智慧,共同建设分布式数据库的未来,希望更多的眼睛和更多的场景去打磨OceanBase,进一步强化OceanBase数据库工程上的稳定性和完整性。

  三是,OceanBase十年来在分布式数据库做了工程上的实践和探索,在这个过程中也遇到了很多工程技术和理论上的挑战,闭源限制了产学研的沟通交流,无法深入研究。开源有助于OceanBase与高校等更好地进行产学研协同互动,共同推动分布式数据库发展。

  对于OceanBase和分布式数据库的发展而言,杨冰从以上三点解释了开源的原因。实际上开源也打消了部分客户的顾虑,现在国内去“IOE”的浪潮为国产数据库带来的新的机遇,杨冰介绍过去一年与企业交流时发现不少客户有“从一个‘O’到另一个‘O’”的担忧,此次开源表明OceanBase开放的态度和决心,可以打消企业的顾虑。

  如今国内数据库市场呈现百花齐放的状态,国产数据迎来了前所未有的机遇。2021年,IDC针对中国企业数据库使用情况进行了调研,调研显示,企业将继续增加对数据库的资金投入:在过去两年(2019-2020),98%被访企业表示增加了对数据库的资金投入,未来三年,几乎所有被访企业均表示会增加对数据库的投入,整体增幅较前两年也会稍有增加,主要集中在15-30%区间范围内。

  虽然现在国内数据库市场竞争格局未定,但是各方参与之下,竞争也非常激烈,时间窗口有限,正值跑马圈地之际,选择开源也能为OceanBase赢得市场换取时间。著名公司Elastic的一路高歌猛进证明了开源的力量。

  当前,开源已成为全球软件技术和产业创新的主导模式,覆盖了软件开发的全域场景,全球97%的软件开发者和99%的企业都在使用开源软件,很多基础软件也是基于开源。随着“十四五”首次将开源纳入规划,政策层面的东风也助推国内开源迎来新的发展机遇。

  杨冰指出,现在OcanBase技术方面已经成熟,再加上OcanBase已经正式成立公司,以公司化的方式去运作是一个更好的支撑,能够达到商业和开源的平衡,可以持续投入开源。“我相信路选对了就不怕远。”杨冰说。

0
相关文章