数据库 频道

8月数据库圈值得关注的事

8月,Gartner发布《2023中国数据库管理系统市场指南》指出,2022年,中国DBMS市场规模增长至63.24亿美元,中国供应商的市场份额增至50.1%,首次超过50%;IDC《2022年下半年中国数据仓库软件市场跟踪报告》显示,2022年中国数据仓库软件市场规模为8.7亿美元,同比增长23.7%;DTCC2023中国数据库技术大会召开,国产化替代与核心技术创新成为焦点,分布式数据库、云数据库、向量数据库、图数据库等引发关注;Neon获4600万美元B轮融资;DBtune获得种子轮融资;StarRocks 3.1 发布;OceanBase自研开发工具ODC开源……

市场动态

Gartner发布《中国数据库市场指南》

8月初消息,Gartner发布《2023中国数据库管理系统市场指南》( Market Guide for DBMS, China ,2023)。Gartner指出,随着本地云计算多样化市场格局的形成,以及技术自给自足趋势的驱动,中国数据库管理系统(DBMS)市场正在快速增长与变化。

Gartner数据显示,2022年,中国DBMS市场规模增长至63.24亿美元,比2021年增长了11.4%;其中,中国供应商的市场份额增至50.1%,首次超过50%。并预测到2025年,海外供应商在中国分析型数据库的市场份额将仅占30%,在交易型数据库市场份额约为50%。

IDC:2022年中国数据仓库软件市场规模达到8.7亿美元

8月18日,IDC《2022年下半年中国数据仓库软件市场跟踪报告》显示,2022年中国数据仓库软件市场规模为8.7亿美元,同比增长23.7%。其中,本地部署数据仓库软件规模为4.6亿美元,同比增长12.5%;公有云数据仓库软件规模为4.1亿美元,同比增长39.3%。IDC预测, 到2027年,中国数据仓库软件市场规模将达到27.3亿美元,2022-2027的5年市场年复合增长率(CAGR)为25.7%。

从部署模式来看,出于数据安全和合规性的考虑,本地部署模式的数据仓库产品仍将是政府、金融、能源、以及大型企业的首选。同时,传统国际数仓品牌由于支撑当前海量数据分析场景的成本较高,企业正在寻求替代方案,而本土厂商的性价比更具优势。

与本地部署市场相比,公有云数据仓库服务的市场集中度更高,前五名厂商份额共计超过90%。预计到2027年,公有云数据仓库市场规模占比将从2022年的47.2%上升到62.6%。

DTCC2023中国数据库技术大会召开

2023年8月16日~18日,由盛拓传媒旗下IT168、ITPUB、ChinaUnix技术社区主办的第十四届中国数据库技术大会(DTCC2023)在北京国际会议中心隆重召开。本届大会以“数智赋能 共筑未来”为主题,设置2大主会场,18+技术专场,邀请超百位行业专家,重点围绕HTAP与多模数据库应用、图数据技术、海量数据架构下的应用实践、云原生数据库、异构环境下的数据管理工具创新等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

ITPUB总经理、DTCC中国数据库技术大会创办人唐川向广大的社区技术专家发出了诚挚的邀请,希望更多专家可以加入ITPUB私享会。唐川表示,ITPUB私享会是针对行业应用实践,企业技术痛点,邀请企业高层探讨关注的难点问题开展的闭门式圆桌交流会,促进企业之间的交流和共享。

在本次大会上,国产化替代与核心技术创新成为焦点,分布式数据库、云数据库、向量数据库、图数据库等引发关注。

OB 将独立、谋求 IPO

据知情人士向 The Information 表示,蚂蚁集团计划拆分 OceanBase(运营主体:北京奥星贝斯科技有限公司)成为一家独立公司。OceanBase 年营收为数亿元人民币,仅占蚂蚁集团总营收的极小一部分。知情人士补充道,OceanBase 可能会在国内股市寻求 IPO。

投融资

PostgreSQL商业公司Neon获4600万美元B轮融资

8月1日消息,Serverless PostgreSQL 数据库公司 Neon 宣布在 B 轮融资中成功募集到 4600 万美元。这使该公司的融资总额达到 1.04 亿美元。新一轮融资由 Menlo Ventures 领投,Founders Fund、General Catalyst、GGV Capital、Khosla Ventures、Snowflake Ventures 和 Databricks Ventures 参投。

Neon 于 2022 年推出了自己的Serverless云服务。Neon 团队面临的一个挑战是Serverless数据库的 “冷启动 ”问题。传统数据库部署的服务始终在运行,但Serverless并非如此,它是按需提供服务,有一些虚拟服务需要在需要时启动,这就导致了冷启动问题,因为数据库需要启动并开始运行。冷启动会导致查询响应延迟,因为数据库需要时间才能运行。

Neon 团队已经解决了冷启动和自动扩展问题,其CEO Shamgunov 说,冷启动一度需要 3 秒钟,这对于生产部署来说并不理想。最近几个月,Neon 团队已经解决了这个问题,现在冷启动时间已经降到了 200 毫秒以下,而且还在继续改进。

Neon 将提供比PG本身的向量搜索插件 pgvector更好的功能,使用一套额外的算法和自己的向量扩展(称为 pg_embedding)来帮助进一步提高准确性。

瑞典初创公司DBtune完成 240 万欧元种子轮融资

8月1日消息,瑞典初创公司DBtune完成 240 万欧元种子轮融资,旨在向云数据库用户提供基于AI的数据库调优、数据库成本优化等服务。有了这笔资金,公司计划加强产品供应,通过招聘新员工来扩大团队,并加快发展速度。

据 DBtune 称,其客户可以减少计算资源需求,从而提高金融开发运营(FinOps)的效率。此外,用户还可以节省云信用额度,减少对二氧化碳的影响,从而实现环境、社会和治理(ESG)目标。

产品与解决方案

StarRocks 3.1 发布,云原生湖仓范式重磅升级

StarRocks 自 4 月底发布 3.0 版本,拥抱云原生,开启极速统一的湖仓新范式。8 月 7 日,StarRocks 正式发布全新 3.1 版本,全面提升云原生存算分离构架、极速数据湖分析、物化视图等重量级特性,让用户更简单地实现极速统一的湖仓分析。

StarRocks 3.1 版本湖仓一体分析功能更完善、更易用:

·存算分离架构功能对齐存算一体,支持业界广泛应用的主键表模型及相关功能,让存算分离更好地支持实时分析场景;性能上,查询和导入性能也基本与存算一体架构持平。

·极速数据湖分析性能进一步提升,比 Trino/Presto 快 3-6 倍, 并实现常用 Trino 语法的完全兼容;增加 Apache Iceberg 的读写支持、对流式数据湖 Apache Paimon 的分析支持,让数据湖分析更加实时、简单、高效。

·异步物化视图上,进一步提升物化视图构建、刷新的稳定性,并提供更多灵活易用的创建和刷新参数、增加更多场景的 SQL 智能改写。

·StarRocks 3.1 提供了随机分桶、表达式分区、FILES 表函数等更多新功能、新模式,进一步提升建表/分区/导入中的易用性。

TuGraph 开源 ISO GQL Antlr4 语法文件,推动图数据库查询语言标准化

8月9日消息,TuGraph 团队开源了基于最新的图数据库标准查询语言 ISO GQL(草案)实现的 Antlr4 语法文件,并对表达式等语法定义进行了大量重构,大幅提升了 Antlr4 解析阶段的性能。使用者可以通过 Antlr4 快速接入到现有的图数据库产品之中,快速适配和体验 ISO GQL 最新的语法能力。

TuGraph团队基于2023年3月版本草案中的语法规范,编写了 ISO GQL 的 Antlr4 语法文件,并进行了大量的优化工作,提高了 Antlr4 解析 ISO GQL 语句的性能。Antlr4已在蚂蚁集团内部系统和业务中实际投入使用,平均可以提升解析速度数十倍,在一些复杂查询语句场景下,甚至可以提升至上百倍。

NebulaGraph v3.6.0 正式发布,强化全文索引能力

8月14日消息,NebulaGraph v3.6.0 正式发布,新版本主要强化全文索引能力,以及优化部分场景下的 MATCH 性能。

OceanBase自研开发工具ODC开源,继续落实开发者友好理念

8月18日,OceanBase ODC 4.2.0 版本正式发布并宣布开源,ODC 开源选择了足够开放的 Apache 2.0 协议。

ODC 作为数据库厂商自研的开发工具,其最初定位是让 OceanBase 的 开发者有一个图形化开发工具,支持 SQL 开发、数据导入导出、PL 执行调试 等开发过程的必须功能。ODC 之于 OceanBase,类似 Oracle 自研的 SQL Developer,SQL Server 自研的 SQL Management Studio。

团队认为,ODC 开源能够让 ISV 和客户的自建系统集成 OceanBase 更容易,从而提升 OceanBase 生态活跃度、降低 OceanBase 交付支持成本。这次 ODC 开源,不仅是开放了 ODC 的代码,同时 ODC 开发过程中积累形成的基础组件同步开源,比如 db-browser 对数据库字典视图的访问做了封装等。把 ODC 产品开源,是对 OceanBase 开源社区的重要补充,作为一个开发者产品,源码开放还是对 OceanBase 文档的高质量补充。

超聚变联合沃趣科技发布QData T7数据库一体机解决方案

8月18日,超聚变联合沃趣科技发布基于超聚变最新一代Fusion Server 2288H V7服务器打造的QData T7数据库一体机产品, 将服务器、网络、存储进行高度集成,实现业务性能、平台可靠性、业务连续性及可用性的提升。

硬件底座方面,全新一代FusionServer V7智能服务器,通过CPU调优、自研电源、节能算法、散热和高速互联等关键技术,实现了同等配置下综合性能领先业界10%,节能8%。软件创新方面,通过创新的QScan技术,实现业界最高的300GB/s数据吞吐量。

Pigsty v2.3 发布:应用生态丰富

8月22日消息,Pigsty v2.3 发布,新版本中进一步完善了监控系统、应用生态、并跟进 PostgreSQL 例行的小版本更新(CVE修复)。

Pigsty v2.3 跟随 PostgreSQL 主干小版本进行更新,包括 15.4, 14.9, 13.12, 12.16 以及 16.beta3,此更新修复了一个 CVE 安全漏洞。此外高可用管控 Patroni 也升级到 3.1 版本,解决了一些 BUG 。

Neo4j 推出向量嵌入存储功能挺近大模型时代

大语言模型和图数据库的整合充满了可能性。图数据库供应商Neo4j在8月22日宣布推出向量嵌入存储功能,使其能够充当GPT等大语言模型的长期存储器。

Neo4j 首席科学家Jim Webber认为,客户可以采用三种模式来整合图形数据库和 LLM。

第一种是将 LLM 用作与图数据库交互的便捷接口。第二种是从 LLM 创建图数据库。第三种是直接从图形数据库训练 LLM。“目前,这三种情况似乎非常普遍。”Webber说。

MatrixOne 内核 v1.0.0-RC1 版本发布

8月24日,MatrixOne 内核 v1.0.0-RC1 版本正式发布,这是一个重要的里程碑,标志着 MatrixOne 已经基本实现一个超融合异构云原生数据库的主要功能。MatrixOne 内核 1.0 GA 及 MatrixOne Cloud 正式版也将在近期发布。

MatrixOne 的设计和开发始终聚焦在资源利用最大化和超高性价比、简化数据处理架构、降低用户数据处理难度等几个方面。MatrixOne 1.0.0-RC1 的功能与性能已经基本上达成了架构设计目标,完整的实现了云原生及存算分离、冷热分离和细数据颗粒度的读写分离架构,具备了一款 SQL 数据库产品的主要功能,且在 OLTP,OLAP,时序几个不同负载下的性能均表现良好,也已经提供了最基础流计算能力。

EDB Postgres 分布式版本DBaaS云服务全面可用

8月30日,EnterpriseDB(EDB)宣布了一个重要的里程碑,EDB BigAnimal上的EDB Postgres 分布式版本的全面托管Postgres即服务全面可用。该公司将其 Postgres 分布式版本引入了云原生环境,带来了Postgres 云服务的高可用能力。

EDB提供Postgres的专业技术,包括混合云、自主管理的私有云解决方案,以及全面管理的云数据库即服务(EDB BigAnimal)。EDB Postgres 分布式版通过允许用户在多个节点上运行 Postgres 实例,提高了可用性和性能。此外,它还提供了诸如自动故障转移、负载平衡和多版本控制等功能,使 Postgres 在云中变得更加强大。

0