数据库 频道

云原生数仓竞争加剧,如何打造自己的差异性?

云计算正在成为数字时代的基础设施,数据库上云的速度也在加快。近些年,云原生数仓在Snowflake的带动下引发了广泛关注,不少人看到了新机会,摩拳擦掌下海创业。

拓数派便是在这样背景下成立的数据库初创公司,日前,该公司发布了PieCloudDB「云上云」版,迈出了进军公有云的第一步,当天基于阿里云构建公有云数据仓库服务也正式上线。

云原生虚拟数仓的诞生

2021年2月,拓数派在上海成立,其创始人&CEO冯雷(Ray Von)此前担任Pivotal(中国)的创始人兼总经理,MPP数据库的代表Greenplum便是Pivotal旗下产品。

在云时代,云原生数仓是大势所趋。但是云原生数仓并不是简单将数据库仓库搬上云,而是需要基于云这一新的基础设施重构,拓数派提出了云原生数仓虚拟化的概念。

“新一代云原生数仓虚拟化,可将多个数仓统一整合到一个高可用的云虚拟数仓,打通多云的数据管道,数据计算资源按需扩缩容,提升数仓的敏捷性和弹性,助力企业降低数仓管理复杂度,实现数量级增加可计算数据空间的同时,数量级降低数仓成本,打开无限数据计算空间,推进AI/BI到下一个精度。”冯雷在会上介绍。

具体来看PieCloudDB的技术路线,拓数派CTO郭罡介绍,PieCloudDB重新打造PostgreSQL 12实现存算分离,打造全新 eMPP(elastic Massive Parallel Processing,弹性大规模并行计算)架构,实现了数仓虚拟化。PieCloudDB完全兼容PostgreSQL的生态和特性,并且实现了基于云的高弹性和高可用架构。

冯雷介绍,PieCloudDB将数据库三个模块元数据管理、用户数据管理、计算打散,在云上重构,元数据放到KV存储,用户数据放到对象存储,计算放到虚拟机或容器上,打造新一代云原生虚拟数仓。运用元数据-计算-数据分离的三层架构,实现云上存储资源与计算资源的独立管理。据悉,PieCloudDB基于FoundationDB打造的KV持久层存储元数据,这与Snowflake类似,Snowflake也使用FoundationDB来存储元数据。

此外,PieCloudDB打造了全新的优化器达奇,达奇优化器支持聚集下推,预计算,Block Skipping等高级特性,可以满足复杂的分析查询需求。

郭罡介绍,拓数派一直在向着云时代真正的云原生数仓演进,去年10月24日,PieCloudDB 1.0发布,从技术和产品上实现了云原生,今天发布了PieCloudDB云上云版本,并在阿里云上线服务,迈出了公有云第一步,“云上云”的名字也表达拓数派是中立的云数仓提供者,不会与云厂商绑定。

据悉,未来拓数派将围绕PieCloudDB,打造产品生态、社区生态及商业生态。

云原生数仓竞争加剧

近些年,随着数据的价值越来越凸显,业务的复杂性和动态变化需求对数据库处理提出了越来越高的需求,越来越多的数据库初创公司走入云原生数仓的赛道。他们有不同的技术源,有的基于ClickHouse,有的基于Postgres。其中一部分已经突破了单一的数仓,走上了湖仓一体的道路。

郭罡认为,随着业务场景需求越来越明晰,未来各家云原生数仓可能会有一定的趋同,但是在细节上大家会产生差异。PieCloudDB是坚定走公有云路线,目前PieCloudDB的客户多数采用私有云部署,但是公有云的收入预期会逐步递增。未来会把更多的资源向公有云倾斜,在产品方面,未来大家会有很多不一样的地方。

此外,今年2月,拓数派发布了eMPP存算分离软硬件一体机,支持国产化信创环境,云原生数仓新创公司发布一体机并不多见。

数据库上云虽然是大势所趋,但是中国与欧美这些海外地区有很大的不同,海外采用公有云的相对多一些,中国的企业出于安全等方面的因素,很多对公有云还比较谨慎,对数据安全要求更高的行业,有不少还在采用本地部署。

一个公司的产品发展与用户需求相适应,公司的发展节奏考验着团队的智慧。在技术和产品之外,生态也是数据库厂商的必争之地,中国数据库初创公司在数据库生态建设上普遍处于起步阶段,在拓数派们面前的,是一个机遇与挑战并存的市场,打造独特具有优势的差异性是决定成败的关键。

0
相关文章