数据库 频道

6月数据库圈值得关注的事

6月,数据库圈较为热闹,IDC《2022年下半年中国关系型数据库软件市场跟踪报告》显示,2022年中国关系型数据库软件市场规模为34.3亿美元,同比增长23.9%;中国大陆首个SIGMOD最 佳论文奖出炉;Stackoverflow 2023年度调查:PostgreSQL成为开发者首选;Snowflake和Databricks争相布局AI……

市场动态

IDC:2022年中国关系型数据库软件市场规模为34.3亿美元

6月5日消息,IDC《2022年下半年中国关系型数据库软件市场跟踪报告》显示,2022年中国关系型数据库软件市场规模为34.3亿美元,同比增长23.9%。其中,公有云关系型数据库规模20.8亿美元,同比增长34.8%;本地部署关系型数据库规模14.6亿美元,同比增长10.3%。IDC预测,到2027年,中国关系型数据库软件市场规模将达到102.7亿美元,2022-2027的5年市场年复合增长率(CAGR)为24.5%。

IDC:中国数字化转型支出将以17.9%的年复合增长率增长

6月9日,2023年V1版IDC《全球数字化转型支出指南》(IDC Worldwide Digital Transformation Spending Guide)数据显示,2022年全球数字化转型投资规模超过1.5万亿美元,并有望在2026年迈过3万亿美元大关,2021-2026年五年复合增长率(CAGR)约为16.7%。随着全球数字化转型市场蓬勃发展,云计算、人工智能、大数据、 5G等技术的应用范围不断扩大,全球企业的数字化转型已经来到了持续发展阶段,这也促使了企业不断加大其在数字化转型的投入。

在中国市场,到2026年,中国数字化转型支出规模预计超过6,000亿美元,五年复合增长率将达到17.9%,增速位于全球前列。

中国大陆首个SIGMOD最 佳论文奖出炉

6月18日-23日,数据库国际顶会 2023 ACM SIGMOD 在美国西雅图举行,2023年,SIGMOD仅收录190篇论文,由浙江大学与阿里云共同完成的《在数据库管理系统的连接优化器中检测逻辑漏洞》成果脱颖而出,斩获2023 SIGMOD最 佳论文奖,这一新方法较以往方案提速近100倍,被审稿人评价为漏洞检测新范式。这也是SIGMOD会议举办以来,第一次由中国大陆研究团队摘得最 佳论文奖,实现了中国大陆研究团队在数据库国际顶会的历史性突破。

Stackoverflow 2023年度调查:PostgreSQL成为开发者首选

Stack Overflow 2023年度调查显示,PostgreSQL从MySQL手中接过了第一名的位置,成为开发者的首选。有45.55%的开发者正在使用PostgreSQL,有41.09%的开发者正在使用MySQL。

调研发现,专业开发者比学习编程的人更有可能使用PostgreSQL(50%),学习的人更有可能使用MySQL(54%)。MongoDB在专业开发者和学习编程者中的使用比例相似,它是学习编程者中第二受欢迎的数据库(仅次于MySQL)。

值得一提的是,中国开源数据库TiDB今年榜上有名。

数据仓库公司「飞轮科技」完成数亿元的新一轮融资

6月1日消息,实时数据仓库公司「飞轮科技」已于日前完成新一轮融资。本轮融资金额在数亿元级别,投资方暂未披露。公司介绍,这是飞轮科技成立一年内完成的第三轮融资,金额总数已近10亿元。

飞轮科技成立于 2022 年初,其核心团队成员均来自百度、腾讯、阿里、亚马逊、字节跳动、蚂蚁金服等国内外头部互联网和云计算公司。作为基于 Apache Doris 的商业化公司,飞轮科技秉承着 “开源技术创新”和“实时数仓服务”双轮驱动的战略,基于 Apache Doris 内核打造了聚焦于企业大数据实时分析需求的企业级产品 SelectDB 。

目前,飞轮科技已发布了 SelectDB Cloud 和 SelectDB Enterprise 两款企业级产品,以满足来自云上和私有化部署用户的不同需求。在本轮融资后,飞轮科技除了聚焦于自身产品能力的提升外,也将不断扩大自己的商业版图,在全球市场中开拓自身业务。目前,公司团队人数近 200 人,大部分是研发人员。

Databricks以13亿美元收购大模型初创公司MosaicML

6月26日,Databricks宣布以13亿美元收购大模型初创公司MosaicML,战略押注AIGC,完善其Data+AI的布局。

MosaicML于2021年在旧金山成立,是OpenAI的竞争对手,帮助企业训练并部署自己的大模型,迄今已从投资者那里筹集了近6400万美元,上一轮融资其投后估值2.2亿美元,此次被收购的估值较前者提升了6倍。

据悉,这笔交易要求MosiacML整个团队的60多名员工,包括联合创始人&首席执行官Naveen Rao在内都会加入到Databricks,他们将继续致力于开发更多的基础模型。未来,Databricks将把MosaicML的模型训练能力添加到其Lakehouse平台。

产品与解决方案

华为云发布新一代分布式数据库GaussDB

6月7日,华为全球智慧金融峰会2023在上海召开。在峰会上,华为常务董事、华为云CEO张平安全面介绍了华为云基于全云化底座、分布式数据库GaussDB、分布式中间件以及可信的开发工具等构建的金融分布式新核心,并正式发布了新一代分布式数据库GaussDB。

未来,GaussDB将深耕金融场景,通过全面创新,成为金融客户数据库更优的选择;并从金融行业走向其他对数据库有高要求的行业,从中国的创新场景走向全球的客户,给世界一个更优的选择。

在大会现场,张平安携手17家软件伙伴企业、7家服务伙伴企业,共同启动了《GaussDB数据库金融行业生态发展计划》。

Bytebase 2.2.0 发布,支持通过数据库分组进行批量变更

6月9日,Bytebase 2.2.0发布。新版本支持通过数据库分组进行批量变更,支持表级别的数据查询管控,SQL 编辑器支持同时执行多条 SQL SELECT 语句,支持 OceanBase 的 SQL 审核。

蚂蚁图计算平台开源业内首个工业级流图计算引擎

6月11日,2023开放原子全球开源峰会在北京开幕,在高峰论坛上,蚂蚁技术研究院院长、图计算负责人陈文光宣布开源 TuGraph 图计算平台核心成员——工业级流式图计算引擎 TuGraph Analytics。

去年9月,蚂蚁集团开源了 TuGraph 图计算平台中的图数据库 TuGraph DB。这次开源是 TuGraph 图计算平台的又一次开源升级,进一步加大了蚂蚁在图计算基础软件领域的开放力度,也是通过开放协同促进科技创新的实际行动。

此次开源的工业级流式图计算引擎是蚂蚁从2017年开始布局打造,经过五年多工业级应用大考,流式图计算做到了在千亿数据规模的“图”上秒级延迟计算,是蚂蚁风控的核心基础技术,成功解决了金融场景风险分析难、识别率低、时效性差等业界难题。

Apache Doris 1.2.5 版本正式发布

6月19日,Apache Doris 1.2.5 版本正式发布。在 1.2.5 版本中,Doris 团队已经修复了自 1.2.4 版本发布以来近 210 个问题或性能改进项。同时,1.2.5 版本也作为 1.2.4 的迭代版本,具备更高的稳定性。

时序数据库CnosDB 发布 V2.3.1版本

6月29日消息,时序数据库CnosDB 发布 V2.3.1版本,提升了稳定性和性能。

在2.3.1 版本中,新增了如下特性:提供 trace 功能(SQL Trace)、支持滑动窗口的 Gap Fill、支持 Flight SQL 的元数据api、支持授予 Admin 权限、实现了Sample函数、Client 端支持 Https 。

此外,还修复并优化了 30+ 个功能,其中涉及数据库读、写、缓存、Compaction等。

CnosDB 2.3是该公司2023年度发布的首个LTS(Long Term Support)版本,在该版本上首次实现了流计算、分级存储和订阅(企业版)等功能。2.3.1 版本相对于2.3版本,能够更加保证稳定性和准确性。

Databricks放大招,布局AI、通过Delta Lake 3.0统一数据格式

在周一刚宣布收购MosaicML之后,Databricks在其数据+人工智能峰会上发布了一系列新的人工智能功能,旨在使其客户能够创建生成式人工智能应用,包括Lakehouse AI中的大型语言模型(LLM)和新的向量搜索功能以及名为LakehouseIQ的数据分析自然语言界面。

其中LakehouseIQ,利用一个预先建立的LLM,旨在使客户能够探索和查询他们存储在Delta Lakehouse中的数据。

在最近的峰会上,Databricks宣布在Delta Lake 3.0中推出了一种新的开放表格式,据称这将消除选错表的可能性。新的表格式被称为通用格式(UniForm),可以读写所有三种流行的数据表格式,包括Delta Table、Apache Iceberg和Apache Hudi。

目前开放式表格式在Delta Table与Iceberg与Hudi之间一直存在竞争,有分析称UniForm的推出是一个聪明的办法,目前Snowflake也是战火正酣,Databricks正扩大自己的生态圈。

Snowflake与NVIDIA合作,用NeMo来训练定制AI模型

在Snowflake峰会上,NVIDIA和云数据仓库公司Snowflake宣布已经合作,帮助企业利用他们存储在Snowflake平台内的数据建立和训练自己的定制AI模型。

此举将看到NVIDIA用于开发大型语言模型(LLM)的NeMo框架与Snowflake整合,允许公司使用其Snowflake账户中的数据,为生成式人工智能(AIGC)服务制作定制的LLM、聊天机器人、搜索和总结提供服务。

0
相关文章