数据库 频道

9月数据库圈值得关注的事

9月,不少关于数据库的会议举办,为我们呈现了新的产业动态。有数据指出,截止到去年年底,中国数据库企业在国内市场份额已经达到75%;向量数据库仍然是焦点,很多数据库厂商在积极布局;Databricks获得新一轮5亿美元融资,投后估值达430亿美元……

市场动态

数据库产业发展现状与趋势

在第二十五届中国国际软件博览会·中国数据库产业峰会上,国家工业信息安全发展研究中心软件所副所长李卫在演讲中总结了我国数据库产业发展的未来趋势:

  • 数据库多点开花,关系型与非关系型齐头并进

    我国数据库排行榜关系型数据库依旧是主流,关系型和非关系型数据库(如图数据库、实时数据库)领域全面开花。

  • 技术架构持续演进,成就多元混合数据库时代

    硬件性能提升,互联网、云计算等新兴技术持续发展,数据库从数据模型、架构、开发和部署模式等方面演进出不同的技术路线,实现架构的跃迁。

  • 新时期数据库行业应用特点鲜明

    国产数据库在各领域全面应用,逐步从边缘系统走向核心系统,同时对数据库的需求又不尽相同。

国产数据库市场份额达75%

在2023上海外滩大会“分布式数据库助力数实融合”见解论坛上,中国电子信息产业发展研究院副院长乔标说,截止到去年年底,中国数据库企业在国内市场份额已经达到75%,数量超过200家。

中国信通院发布《开源数据库生态发展研究报告》

9月21日,在中国信通院举办的2023 OSCAR开源产业大会上,《开源数据库生态发展研究报告》正式对外亮相。该报告针对MySQL数据库发展现状、技术创新、产业应用三方面梳理了发展情况,并对我国基于MySQL技术路线的开源数据库产业进行展望。

随着信息化建设的不断深入及国内开源数据库技术水平的增强,国内MySQL技术路线开源数据库从以下五个维度进行技术创新,打造最符合国内用户需求的开源数据库。

  • 一是组复制(MGR)技术增强数据一致性;

  • 二是MySQL双活架构实现数据库高可用;

  • 三是推动数据库OLTP、OLAP性能优化,突破MySQL性能瓶颈;

  • 四是通过密码限制增强、级联权限回收能力筑牢数据安全防线;

  • 五是打造多种数据库迁移方案助力MySQL上云。

通过本次调研了解到,安全性、开源服务支持稳定性等问题也加大了用户使用的担忧。

Databricks 获 5 亿美元上市前融资

9月14日,Databricks 获得了5亿美元I轮成长融资,投后估值为430亿美元。本轮融资由 T. Rowe Price Associates 领投,包括一些现有投资者,如 Andreeson Horowitz 等。参与本轮融资的新投资者包括英伟达公司(Nvidia)和 Capital One Ventures。

5 亿美元的投资听起来不少,但这还远远称不上是 Databricks 最大的一轮投资。它的上一轮融资于 2021 年 8 月完成,金额达 16 亿美元,而就在那之前六个月的 G 轮融资则带来了 10 亿美元的资金。

Databricks还公布了一些有关自己的数据。例如,它表示营收已突破 15 亿美元,收入同比增长超过 50%。

产品与解决方案

南大通用发布向量数据库

9月1日,由天津市工业和信息化局指导,天津南大通用数据技术股份有限公司承办的第二十五届中国国际软件博览会·中国数据库产业峰会在天津顺利召开,会上,GBASE南大通用重磅发布国产向量数据库GBase Cloud Vector DB,GBase Cloud Vector DB在GBase 8a集群基础上实现,可以被广泛应用于各类 AI 驱动的应用场景,为大模型关键技术和极致数字世界而来,代表了当今数据库技术的最新发展趋势和成果,向量数据库的推出,进一步完善了GBASE全栈的数据库产品矩阵。

Pigsty v2.3.1 发布

9月4日消息,Pigsty v2.3.1 发布,该版本中 PGVECTOR 迎来 v0.5 更新,添加了新的 HNSW 索引支持。也对新发布的 PostgreSQL 16 RC1 提供了支持。此外,官方文档现在提供中文版本,现有文档也进行了丰富与完善。此外,还有例行的软件版本更新与问题修复。

Apache Doris 2.0.1 & 1.2.7 版本正式发布

9 月 4 日 ,Apache Doris 2.0.1 和 Apache Doris 1.2.7 这两个版本正式发布,这两个版本由上百名位贡献者共同努力完成,提供了更多有用的新特性,同时修复了若干已知的问题,进一步提升了系统的性能和稳定性。

滴普科技发布Deepexi企业大模型产品

9月6日,在2023中国国际服务贸易交易会成果发布会上,滴普科技发布了Deepexi企业大模型及落地成果,Deepexi是滴普科技打造的首个企业大模型产品,包含了多个领域模型、基础模型栈、模型工具链三大核心能力。基于FastData,滴普科技在服务企业数字化转型过程中,积累了丰富的知识语料库,并以此为基石打造了生产制造、运营管理、财经管控、数字双碳等多个领域模型以及模型应用。

此外,滴普科技企业服务领域的多模态模型工具链已在社区开源,回馈和建设企业服务领域的模型产业落地。

蚂蚁集团正式开源万亿规模图学习系统AGL

9月7日下午,上海外滩大会“融合机器学习与运筹优化”论坛上,蚂蚁集团正式开源图学习系统Ant Graph Learning (AGL),这是行业首个通用的工业图学习系统。 AGL目前实现了万亿规模图数据上的信息协同和结构感知,构建了多个行业数字化图智能方案,也沉淀了多个优秀的算法实践。蚂蚁集团基于AGL,发表CCF-A/B类国际期刊会议论文60余篇,授权发明专利40余项,五项国际榜单、竞赛第一,也是图神经网络国家标准的核心参与单位。 本次开源AGL v0.1版本,同时提供蚂蚁多年打磨的工业级图学习系统和一系列经过业务实践验证的开箱即用的图学习算法,代码仓库已于当天上架GitHub。

腾讯云原生数据库TDSQL- C Serverless 2.0版发布

9月7日,在2023腾讯全球数字生态大会云原生数据库技术演进与实践专场上,腾讯云分享了在该领域的多项前沿探索和核心技术解析,并重磅发布云原生数据库TDSQL- C Serverless 2.0版本。

TDSQL-C采用了创新的“存算分离”架构,具备100%兼容MySQL、超百万QPS性能、多线程并行查询、一体化HTAP、金融级容灾等多种核心特性。其Serverless 2.0新版本具有三大核心特性:

  • 提供Serverless混合集群版,支持只读节点和Proxy弹性能力。该架构的升级也丰富了Serverless当前的应用场景。

  • 可释放存储架构,集群无访问时段数据可落冷归档,启动时可瞬时恢复服务,无需等待数据全量恢复。当实例暂停后,数据会归档存储,其存储成本同比分布式存储最高可降低80%。

  • 平滑弹性扩容,TDSQL-C还首次做到了缩容场景无慢查询,实现了真正意义上的弹性扩缩容。

腾讯云TDSQL融合版发布

9月7日,在2023腾讯全球数字生态大会腾讯云数据库TDSQL技术与实践专场上,腾讯云正式发布TDSQL融合版,该版本整合了之前TDSQL系列产品内核的优势,并在内核架构、Oracle兼容能力、性能、隔离、迁移工具等多个关键能力上进行了大幅增强优化。

HTAP实现上,TDSQL采取松耦合度行列混存架构,在底层通过多个数据分片将数据表均匀分散在不同的存储节点中,并通过主从复制的能力实现数据高可用,既保证了在线交易性能,又保证了高速的分析能力,能够支撑企业超高并发的在线交易型业务。

首个知识图谱融合大模型平台推出

9月11日消息,近日,CCTV报道,由中国工程院院士、清华大学计算机系教授、海致科技首席科学家郑纬民领衔海致科技与高性能图计算院士工作站共同开发的首个知识图谱融合大模型平台正式发布。该平台面向广大B端用户,运用知识图谱这项人工智能基础技术,帮助大模型在企业级和工业界应用中克服“幻觉”,实现基于行业与场景的精准推演。目前已经在能源、金融、政务等领域的场景中进行部署和应用,力图打通通用人工智能进入B端和工业应用的“最后一公里”。

Bytebase 2.8.0发布,全新升级的数据脱敏功能

9月14日消息,Bytebase 2.8.0发布,全新升级数据脱敏等功能。具体新功能包括:

  • 全新升级的数据脱敏功能,提供更加细化的脱敏·和访问权限配置。

  • 全新升级的 SQL 编辑器界面。

  • 库表同步功能支持 Oracle。

  • 支持设置公告。

微软与甲骨文扩大合作关系,推出Oracle Database@Azure

甲骨文公司和微软公司宣布推出Oracle Database@Azure,让客户可以直接访问在 Oracle 云基础设施远程软件服务(Oracle Cloud Infrastructure,OCI) 上运行并部署在 Microsoft Azure 数据中心的 Oracle 数据库服务。Oracle Database@Azure 打造了更简洁的环境,简化了 Oracle 数据库和 Azure 服务之间的采购和管理流程。

从北美和欧洲地区开始,Oracle 将直接在 Microsoft 数据中心内运行和管理这些 OCI 服务。

沃趣科技国产数据库云产品发布

9月15日,在沃趣科技2023国产数据库云产品发布会上,发布更新了多款沃趣产品,包括:高性能国产数据库专有云、QData T7高性能数据库云平台、QFusion数据库私有云、DBMotion、DBTwin等自动化运维工具集。

甲骨文OCW年度峰会推出集成向量数据库

美国当地时间2023年9月18日,一年一度的Oracle CloudWorld如期在美国拉斯维加斯举行。

Oracle推出集成向量数据库,Oracle 宣布计划在 Oracle Database 23c 中添加使用 AI 向量的语义搜索功能。此功能集合称为 AI Vector Search,其中包括新的向量数据类型、向量索引和向量搜索 SQL 运算符,使 Oracle 数据库(Oracle Database)能够将文档、图像和其他非结构化数据的语义内容储存为向量,并以此快速运行相似性查询。这些新功能还支持 Retrieval Augmented Generation (RAG),这是一种创新性的生成式 AI 技术,将大型语言模型 (LLM) 和私有商业数据相结合,以回答自然语言问题。RAG 提供更高的准确性,并通过将私有数据包含在 LLM 培训数据中来避免泄露私有数据。

Fabarta 产品与用户大会成功举办

9 月 19 日,在Fabarta 首届产品与用户大会上,创始人兼 CEO 高雪峰指出,构建面向智能应用的数据基础设施,是助力企业实现决策智能化的关键所在。Fabarta 构筑了以数据为中心的 AIGC 落地架构范式,围绕着数据以及数据之间的关系(图和向量融合)所代表的企业数据,可以帮助大模型进行推理增强,减少模型的幻觉,实现数据的安全可控,并为其提供长效记忆能力。会上还介绍了公司的一体两翼产品矩阵,以多模态引擎为基础,数据与 AI 平台为双翼,为企业提供全链路支持,助力企业实现决策智能化”。其多模态智能引擎 ArcNeural 架构面向云原生,并同时支持图与向量的同表管理。

ByConity 0.2.0 版本发布

9月20日消息,ByConity 0.2.0 版本正式发布,新版本提供多项有用的新特性,同时修复了若干已知的问题,进一步提升了系统的性能和稳定性。

  • 冷读优化,包括 IOScheduler 和 Preload 能力

  • 数据湖支持,包括 Hive,Hudi,Multi-Catalog 等支持

  • ELT 长时任务支持,包括异步执行,队列,算子 Spill 等

  • RBAC

亚信科技发布AntDB 8.0 产品

9月20日,亚信科技发布AntDB数据库8.0版本,AntDB数据库8.0产品实现了两大特性的重磅升级:“超融合架构”从实验室走向生产,流式计算升级为“超融合流式实时数仓”。同时,浙江移动、用友、麒麟软件、华录高诚、金云智联等行业伙伴及业界专家共同探讨了国产数据库发展现状及未来蓝图。

TimescaleDB 现在也是向量数据库了

9月25日,时序数据库厂商Timescale发布了Timescale Vector,TimescaleDB 正式成为向量数据库。

TimescaleDB采用了 postgres 的开源向量库 pgvector。除了采用 pgvector 之外,该公司还通过使用近似近邻(ANN)算法增强了向量功能,并声称这种算法的性能比普通 pgvector 和专用向量数据库都要好得多。

几个月前,Timescale 向云客户推出了向量支持,今天它正式宣布开始预览计划。该公司的向量功能已经吸引了一些早期采用者,其中包括欧洲回收解决方案提供商 PolyPerception。

ClickHouse 宣布推出 ClickPipes

9月26日,ClickHouse 宣布推出 ClickPipes,帮助简化实时分析的数据管道。Clickpipes是Clickhouse云的一项持续数据摄取服务。它将外部数据源直接连接到 ClickHouse Cloud,使用户能够快速高效地建立数据管道。ClickPipes将与Apache Kakka、亚马逊MSK和Confluent Cloud集成,并计划增加更多集成。

在ClickPipes全面上市之前,ClickHouse Cloud已经经历了一年的发展和扩张。随着ClickHouse Cloud于2022年10月推出,ClickHouse已成为安全、可扩展的无服务云产品。公司最近宣布首次推出专有的 SharedMergeTree 表引擎,从而提高了 ClickHouse Cloud 的性能。ClickPipes完全托管的云产品现已在Google Cloud Platform和AWS上推出。

Confluent 在 Confluent Cloud 上发布 Apache Flink

9月27日消息,Confluent公司日前宣布开放预览Confluent Cloud上的Apache Flink,这是一项针对流处理的全面托管服务,可让企业更轻松地利用Flink过滤、连接和丰富数据流。此外,Confluent 还发布了数据门户(Data Portal),以帮助团队发现组织内的所有实时数据流;发布了企业集群(Enterprise Clusters),以降低无服务器私有网络的 Apache Kafka 成本;并降低了 Confluent Cloud 的存储成本。

The Others

达梦数据博士后科研工作站正式启动

9月25日下午,武汉东湖高新区未来科技城,达梦数据成功召开了博士后科研工作站启动会暨学术专家委员会成立大会。本次大会上,达梦数据博士后科研工作站正式宣布启动。研究对象主要包括数据库领域前沿技术,数据与信息安全、云计算、人工智能等深度融合技术以及中国数据库行业创新发展过程中的现实性、前瞻性、战略性问题。

在大会的致辞中,达梦数据董事长冯裕才强调,达梦博士后科研工作站的设立,对达梦来说是一个新起点。

HTAP Summit 2023:揭秘 Databricks、LinkedIn 等用户喜爱 TiDB 的幕后故事

9 月 20 日 - 21 日,HTAP Summit 2023 在美国加州计算机历史博物馆成功举办,应用开发者、数据库从业者齐聚一堂,现场分享、体验前沿 HTAP 技术。

本次大会共计 30 余个主题分享,嘉宾来自包括 Databricks、Meta、Google、Pinterest、LinkedIn、Bolt、PayPay、Airbnb、Flipkart、Plaid 等公司,分享了他们关于数据库、人工智能等领域的前沿探索,以及使用 TiDB 的真实体验。

0
相关文章