面对复杂多元且多变的业务场景,承载业务的数据库变得越来越复杂,一款简单、易用又好用的数据库是用户和软件供应商共同的追求。一些数据库初创公司做了创新尝试,成章数据便是其中的代表。
2021年成立的成章数据提出了数据基底Data Substrate的新理念,打造模块化可插拔的分布式数据库,像乐高一样任意组合灵活应对不同业务负载,这一新理念在DTCC2023引发关注。近期我们采访了成章数据创始人&CEO陈亮,了解其中的玄妙。
为什么做可插拔数据库?
在官方介绍中,成章数据自主研发的分布式数据库产品可以适用于各个行业,For MySQL,For Redis,For NoSQL多个版本可以满足绝大多数的用户需求。成章数据的产品主要是基于数据基底Data Substrate研发,这一概念来源于团队多年来对数据库架构的思考总结。
陈亮介绍,随着企业业务场景变得更为复杂,数据海量增长,数据库向着多模态发展。从单机到分布式,从SQL到NoSQL细分领域。IT系统架构的复杂度越来越高,企业希望降低系统复杂度,降低开发成本,更好地支撑业务,以实现降本增效。
成章数据的团队发现,虽然数据库产品的种类越来越多,但是不同数据库产品的基础架构需要很多相似的组成,包括事务管理,分布容错,弹性扩容等等,但差异部分“可能只有10%~20%”。所以,成章数据通过对不同数据库共有功能的抽象,以一种模块化的方式,建立标准化API,为不同功能的数据库建立统一的数据基座。希望通过好的系统抽象,降低系统复杂度,降低开发成本,当前存算分离抽象无法支持数据库功能模块的灵活伸缩。
Data Substrate理念的好处是,通过对数据库解耦、抽象出通用模块,一方面可以避免重复造轮子,充分利用现有系统。另一方面,每个功能模块可以在更细粒度资源上伸缩,用户可以根据自己的需求用最小化资源动态伸缩满足其性能要求。
陈亮认为,像乐高一样可插拔、模块化抽象可重复使用、灵活拼装等都不是新的概念,IT系统一直在向着这个方向发展,热门的低代码、微服务等都是这样的理念。以微服务为例,是服务的模块化,如果某服务被很多人可以重用,可以使用微服务的架构,大家可以独立开发,独立伸缩、独立扩容,更好地支持和响应业务的变化。
但是有好的理念不等同于能有好的工程实现,数据库想要做得和乐高一样,其中的关键和难题主要有两点,一是找到抽象,如何解耦,模块怎么切分合适。二是保证拼装的系统有好的性能,至少不比原生系统差,甚至比原生系统还要好。这需要研发新的算法和协议,来保证系统性能。
成章数据在模块抽象方面做了很多探索尝试并找到了合适的解耦方案,目前,其数据基底Data Substrate抽象出了缓存、并发管理、日志、数据存储和计算五大功能模块,自研了新的算法和协议组合这些模块。在效果上,Data Substrate架构能在不牺牲性能的前提下,将数据库的基础功能统一,通过解耦的方式把具备不同功能的模块进行组装,快速构建一个能适应不同场景和应用,更加灵活的数据库,用以满足用户日益复杂的数据处理需求。
在云上发挥数据库可伸缩的价值
实际上,成章数据并不直接售卖数据基底Data Substrate,也不做存储引擎和计算引擎,而是售卖基于数据基底Data Substrate+现有存储/计算引擎打造的标准化数据库产品,目前主要提供For MySQL,For Redis,ForMongoDB三个版本。
成章数据的数据库产品采用云原生架构,更能发挥可伸缩的优势。云计算可提供可伸缩的计算资源、可伸缩的内存资源、可伸缩的存储资源,加上其数据基底Data Substrate五个独立模块所打造的云原生数据库,就能够更好实现缓存、并发管理、日志、存储、计算细粒度的弹性伸缩,助力企业降本增效。
目前,公司主要围绕在线业务的增删改查展开。陈亮指出,其产品差异化和优势在于能够提供更细粒度的伸缩,特别是数据基底的缓存和日志可以分别独立伸缩,对于在线业务能带来更大的价值。所以,成章数据目前主要关注更加灵活多变的在线业务场景,比如出海企业的业务发展更加灵活多变,对新技术的接受程度高,愿意尝试新技术,公司会从出海企业切入。
2022年10月,成章数据获得了线性资本领投的数千万元天使轮融资,资本的认可也为公司带来了助力。公司整体在初创早期阶段,陈亮说,在有限的资源下,公司更多关注最重要的数据基底架构,以及各个模块之间高效协同和系统优化上面。目前,已经有一些在线用户在测试使用公司的产品。虽然新的架构还需要更多真实场景验证打磨不断成长,但在越来越多数据库产品中,成章数据为企业提供了一个新的选择,一个能够更加灵活的适配业务,架构更简单、成本更低的选择。