12月,数据库领域发布了不少报告,为我们在岁末一览数据库市场动态提供了帮助。包括Gartner发布的2024云数据库魔力象限、头豹联合沙利文发布《2024年中国金融级分布式数据库市场跟踪报告》、赛迪顾问发布的2024 年《中国金融行业数据库市场研究报告》等;国家数据局发布第一批数据领域常用名词解释;Databricks获得100亿美元J轮融资……
市场动态
Gartner发布2024云数据库魔力象限
12月18日消息,Gartner近日发布2024云数据库魔力象限,报告深入分析了云数据库的发展趋势和市场需求,聚焦于“愿景完整性”和“执行能力”两大关键维度,通过 15 项核心指标对全球领先的云数据库产品进行了全面评估,并以此评选出进入魔力象限和获得荣誉提及的厂商。
Gartner指出,云数据库管理系统市场已经成熟,核心功能日益商品化,但在日益丰富的周边功能方面仍有创新。更新的功能通常体现在云数据库如何与其他数据管理功能互操作并扩大其范围(数据结构和数据生态)。越来越多的企业在选择供应商时会考虑其数据持久性模型、供应商的战略眼光,以及最重要的一点,即供应商的产品、服务与数据结构或数据生态系统中其他相邻组件协同工作的能力。
国内厂商阿里云依然在领导者象限,华为云上榜挑战者象限。此外,OceanBase、PingCAP、腾讯云获“荣誉提及”。
Gartner预测,到 2028 年,dbPaaS 支出将占市场的 78%。不过,本地部署的份额仍在增长,即使其在整个市场中所占的比例在缩小。这意味着,本地部署/混合解决方案仍然重要,并将继续在市场中占据重要地位。此外,还有一种小规模的 “回归 ”趋势,即回到本地部署,以实现固定成本、隐私、本地数据主权或其他监管或运营原因。供应商需要密切关注本地部署战略,不要忽视。预计这种回流逆势不会扭转向云计算转移的主要趋势。大部分市场正在向云转移,但一些企业认为与本地部署的互操作是该战略的重要组成部分。
大多数供应商正在将 GenAI 功能集成到现有产品中,而不是创建新产品进行销售。支持向量作为原生数据类型,以支持人工智能用例(包括 GenAI)、人工智能助手和自然语言查询就是很好的例子。由于用户希望使用 GenAI,供应商也希望提供 GenAI,因此 GenAI 功能正在成为预期功能,而不是主要的差异化因素。目前还不清楚它是否会在短期内对收入产生重大影响,但购买者会越来越需要它所带来的功能。
IDC发布《GenAI+Data市场趋势分析及最 佳实践案例》
12月23日消息,IDC于近日发布了《GenAI+Data市场趋势分析及最 佳实践案例》。IDC中国调研数据显示,在落地GenAI应用时,68%的企业认为需要梳理内部数据资产,66%的企业希望搭建数据湖等数据底座,同时有62%的受访者认为需要搭建知识库/知识管理体系、清洗标注数据。
向量检索引擎成为数据库基础组件,不仅是原生向量数据库,多种数据库均已搭配向量检索能力,且在检索准确率上可通过RAG框架进行调优,且成本方面具备优势,2025年将有更多厂商推出开源或商业化RAG框架或服务。
头豹联合沙利文发布《2024年中国金融级分布式数据库市场跟踪报告》
12月20日,头豹联合沙利文发布《2024年中国金融级分布式数据库市场跟踪报告》,报告指出,中国金融级分布式数据库市场规模(不包含OLAP)预计将从2023年17.29亿元增长至2028年的54.1亿元,年复合增长率近26%。推动这一市场增长的核心驱动力包括以下几个方面:分布式数据库实践与案例不断丰富、供应端——国产数据库产品能力与生态优化、需求端——信创驱动逐步转移至需求驱动。
2024年9月,中国信息安全测评中心发布了包含十一款分布式数据库的安全可靠测评名单,安全可靠测评名单公布将促进分布式数据库行业健康发展。
安全可靠测评名单公布后的分布式数据库行业发展趋势:在供应端,行业竞争圈子收窄,生态与产品技术路线将成为发展关键;在需求端,金融机构加快与同业以及数据库厂商合作,促进分布式数据库经验沉淀。
报告显示,华为云数据库GaussDB位列2023年、2024年上半年中国金融级分布式数据库市场份额整体规模第一、本地部署整体第一。
赛迪顾问发布 2024 年《中国金融行业数据库市场研究报告》
12 月 31 日消息,近日,赛迪顾问发布 2024 年《中国金融行业数据库市场研究报告》,报告指出,经过几年的发展,2024年开始,金融行业数据库厂商数量已经大幅缩减,一批优秀的企业脱颖而出,成为了金融行业数据库升级的中坚力量。 现阶段,金融业数据库发展主要呈现出集中式数据库仍然为主要产品,分布式数据库增长较快;新兴技术发展催生了金融业数据库行业变革;国产数据库核心系统应用不断增多,市场前景可观;开源数据库在金融业的应用不断增多,用户开始关注开源数据库风险等特点。
报告围绕产品、技术路线、典型项目、优势分析等维度对金融领域数据库厂商进行了分析。OceanBase 获评分布式数据库市场份额第一!在银行、保险、证券三大子市场中,OceanBase 同样以综合评分第一的成绩位居榜首,成为唯一同时在三个行业位列“领导者象限”的分布式数据库。
国家数据局发布第一批40个数据领域常用名词解释
12月30日,国家数据局发布第一批数据领域常用名词解释,包含数据要素、数据资产、数据处理、数据治理、数据安全、元数据、湖仓一体、密态计算、区块链等40个常用数据名词。
买买买的Databricks获得100亿美元J轮融资,估值达620亿美元
12月17日,Databricks宣布获得J轮融资,该公司预计将进行100亿美元的非稀释性融资,迄今已完成86亿美元的融资,估值达620亿美元。
去年9月,Databricks在I轮融资获得5亿美元融资,投后估值430亿美元。由于市场兴趣浓厚,Databricks分配额和估值迅速上升。
Databricks将自己定位为一家Data+AI公司,以简化数据处理和人工智能应用为使命,因其应对现代数据基础设施挑战的能力而备受全球瞩目。自从大模型引爆了新一轮AI革命,企业级数据管理、分析和人工智能系统的需求呈指数级增长,自去年以来,Databricks通过多次收购,加速Data+AI布局,向着自己的愿景方向努力。
据悉,本次J轮融资后,Databricks将把这笔资金投入到新的人工智能产品、收购和国际市场业务的大幅扩张中。除促进公司发展外,这笔资金预计还将用于为在职和离职员工提供流动资金,以及支付相关税费。
产品与解决方案
亚马逊云科技 re:Invent 2024
12月3日,亚马逊云科技re:Invent 2024大会正式起航,本次大会推出了推出两项新的数据库服务,分别是最快的分布式数据库Amazon Aurora DSQL和Amazon DynamoDB global tables(全局表)新功能,强化跨区域一致性。
Amazon Aurora DSQL是专为下一代Aurora打造的无服务器分布式SQL的数据库,读写速度快,可以在多个区域内独立扩展计算和存储,轻松实现99.999%的高可用性。Aurora DSQL采用了新技术和新工艺来克服分布式数据库面临的两大挑战:如何在地理位置不同的节点上以低延迟实现强一致性,以及以微秒级精度同步全球服务器。
Amazon DynamoDB第一个完全托管的无服务器NoSQL数据库,有了全局表新功能,该数据库现支持多区域强一致性,确保客户的多区域应用程序始终读取最新数据,而无需更改任何应用程序代码。
亚马逊云科技在S3对象存储方面推出了Amazon S3 Tables和Amazon S3 Metadata。Amazon S3 Tables是一种新的S3存储桶类型,对Apache Iceberg存储数据进行了优化。Amazon S3 Metadata是元数据服务,以帮助管理Iceberg环境中存储的大量数据,新服务将近乎实时地自动生成可查询的对象元数据,以帮助加快数据发现和提高数据理解能力。
StarRocks Summit Asia 2024,见证Lakehouse新里程
12 月 7 日,StarRocks Summit Asia 2024 于北京圆满落幕。本次峰会共同探讨 Data+AI 的创新与行业实践。
StarRocks TSC Member,镜舟科技 CTO 张友东介绍,StarRocks 社区正以前所未有的速度发展,在过去三年里,StarRocks在 GitHub 上获得超过 9300 颗 star,活跃贡献者超过 400 人,超过 450+ 市值 10 亿美金以上的企业在生产环境使用 StarRocks,各行业对 StarRocks 的认可与期待与日俱增。
通过与 Apache Iceberg、Apache Paimon、Apache Hive 等开放数据湖的深度集成,StarRocks 正在构建完善的数据湖生态,为用户提供极速统一的湖仓分析体验。
Aerospike的最新向量搜索可保持数据新鲜度
12月11日,Aerospike公司今天发布了最新版本的Aerospike向量搜索(Aerospike Vector Search),其强大的新索引和存储创新技术可为开发人员提供实时准确性、可扩展性和易用性。这些进步简化了部署,降低了运营开销,并为及时生成人工智能(GenAI)和机器学习(ML)决策提供了企业就绪解决方案。
最新发布的 Aerospike Vector Search 增加了独特的自修复分层导航小世界(HNSW)索引。这种创新方法允许立即摄取数据,同时异步建立索引用于跨设备搜索,从而实现横向、扩展式摄取。通过独立于查询处理进行数据摄取和索引扩展,该系统可确保不间断的性能、新鲜准确的结果以及最 佳的查询速度,从而实现实时决策。
Aerospike 的多模型数据库引擎包括文档、键值、图和向量搜索,所有这些都在一个系统内。这大大降低了操作的复杂性和成本,让开发人员可以为每个特定的应用用例选择最 佳的数据模型。
Doris Summit Asia 2024
12 月 14 日,由飞轮科技主办,腾讯云和阿里云联合主办的 Doris Summit Asia 2024 在深圳圆满落幕。Apache Doris 创始人 & PMC 成员马如悦指出,今年发布的 3.0 版本是 Apache Doris 研发路程中的重要里程碑,他将这一进展总结为“实时之路”、“统一之路”和“弹性之路”。
从 3.0 版本开始,Apache Doris 开始支持存算分离模式。基于云原生存算分离的架构,用户可以通过多计算集群实现查询负载间的物理隔离以及读写负载隔离,并借助对象存储或 HDFS 等低成本的共享存储系统来大幅降低存储成本。
Apache Doris 自 2013 年创立至今已有 10 年,截至目前,GitHub Stars 已近 13k,社区的贡献者达到近 670 名,平均每月活跃贡献者超过 120 名。
Apache Doris 社区企业规模也在迅猛增长。2022 年社区企业规模不足千家,而经过 2-3 年的的快速发展,以及飞轮科技的技术驱动,企业规模已增至 5000 家,覆盖金融、互联网、电信、游戏、交通物流、零售快消、能源制造等多个领域。
Apache Hudi 1.0.0 版本正式发布
12月16日消息,Apache Hudi 1.0.0 版本正式发布。Apache Hudi 1.0.0 是 Apache Hudi 的一个重要里程碑版本。此版本包含重要的格式更改和令人兴奋的新功能。我们鼓励用户首先在新表上试用 1.0.0 功能。1.0 通用版本 (GA) 将支持从 0.x 版本自动升级表,同时确保在使用 1.0 读取 0.x Hudi 表时完全向后兼容,从而确保无缝迁移体验。
此版本带有向后兼容的写入功能,即1.0.0可以写入表版本8(最新)和较旧的表版本6(对应于0.14及以上)格式。完全支持从 0.x 版本自动升级表,从而最大限度地减少迁移挑战。
Elastic 推出重大升级,提高搜索速度和效率
12与16日消息,Elasticsearch 背后的公司 Elastic 发布了 Elastic 8.17 版,对其平台进行了多项重要改进。该版本重点关注性能提升、功能扩展和更高的运营效率。
新版本的一个主要特点是 Elasticsearch Logsdb 索引模式的普遍可用性。日志对于检测和修复至关重要,但基础设施和应用程序产生的日志量不断增加,导致成本上升,并迫使分析工作受到影响。Logsdb索引模式通过智能索引排序、合成源和高级压缩等功能,减少了磁盘占用和存储日志数据的总体成本。
这家公司还发布了Elastic Rerank,一种由Elastic开发的跨编码器重排模型,用于在不重新索引或更改数据模式的情况下提高搜索相关性。该工具的工作原理是基于对查询和文档的更深入语义理解,改进搜索结果的排序。Elastic 通过 Elasticsearch Inference API 将 Elastic Rerank 轻松集成到现有搜索系统中。该模型在公司的整个产品套件中都有技术预览版。
SQLark V3.2 更新,发布Linux版
12月26日消息,近日,达梦数据发布SQLark V3.2 版本, 带来了Linux 版,本次 Linux 先上线基于 x86 架构 + Kylin V10 操作系统的版本,后续会继续发布其它版本。
SQLark V3.2 版本还带来了 52 条重要的功能优化和问题修复,涉及 SQL 编辑器、表对象、数据生成、数据迁移等用户使用最多的功能。
TiDB 8.5 LTS 发版:支持无限扩展,开启 AI 就绪新时代
12月27日,企业级开源分布式数据库厂商 PingCAP 发布 TiDB 8.5 LTS 版本(Long-Term Support Release),为企业关键业务带来可扩展性、运维洞察力和 AI 就绪能力,助力企业充分释放“Data+AI ”的生产力。
TiDB 8.5 版本专为应对企业级用户的关键业务挑战而设计,包括管理多租户架构、优化实时性能,以及增强超大规模集群的稳定性等。借助 TiDB 8.5,企业可以简化运维流程、降低复杂性,并在以 AI 为核心的工作负载中快速推动创新。
比如,每个 TiDB 集群支持超过 100 万张表,使得 SaaS 供应商能够轻松管理海量数据集,并确保跨租户的一致查询性能。TiDB 8.5 引入了强大的向量搜索功能,助力企业加速实现个性化推荐、欺诈检测和高级分析等 AI 应用的部署等。
openGauss Summit 2024:汇聚数据库创新力量,引领智能时代新未来
12月27日,openGauss Summit 2024在北京召开,会上,弗若斯特沙利文发布最新调研报告,在2024年线下集中式关系型数据库新增市场份额,openGauss系再创新高,达30.2%;基于openGauss的关系型数据库产品占比达28.5%,超过MySQL和PG,成三个主流开源技术路线之首。
openGauss社区理事长熊伟说,openGauss开源四年多,社区一直秉持“共建、共享、共治”的原则,不断凝聚数据库创新力量,在技术创新、商业拓展和生态方面发展迅速。当前,openGauss社区已拥有850余家社区企业成员,7600多名贡献者,并在全世界范围内1623个城市累计超过360万的下载量。商业应用方面,已经走入行业的核心系统,累计装机量达10万以上,在线下集中式关系型数据库新增市场份额达30.2%,基于openGauss开源数据库的关系型数据库占关系型数据库产品总数的28.5%,成中国行业数智化的重要力量。
会上,中移信息、国能信息、四川虹微、联通数科、神舟通用、海量数据、云和恩墨、烽火星空、宝兰德、大湾区国创中心10家伙伴领先发布基于openGauss 6.0.0 LTS的商用版。
openGauss联合中国移动、钉钉和中软发布多种一体机,打造面向不同场景的差异化竞争力。
中国移动信息技术有限公司陈国正式成为openGauss社区顾问委员会一员;openGauss社区将联合华为ICT学院构建人才生态,夯实服务根基;openGauss社区与全球计算联盟(GCC)建立战略合作,开启全球化序幕。
The Others
矩阵起源通过中国信通院“可信数据库”向量数据库基础能力评估测试
12月13日消息,近日,矩阵起源(MatrixOrigin)超融合数据库MatrixOne企业版软件V2.0.0 凭借创新的技术实力,成功通过了向量数据库基础能力专项测试。这一认证不仅体现了矩阵起源在向量能力上的技术先进性和可靠性,也标志着其在推动相关应用落地及行业标准化进程中迈出了重要一步。
腾讯云成为考试宝在向量数据库领域的独家战略合作伙伴
12 月 19 日,职业技能学习平台考试宝和腾讯云达成深度合作,携手推进大模型技术在教育行业的落地与应用。其中,腾讯云还成为考试宝在向量数据库领域的独家战略合作伙伴,携手构建AI时代的“数据枢纽”,为用户打造高性能的海量职业技能试题检索服务。
GBase数据库全栈产品入围“中央国家机关2024年度事务型数据库软件框架协议联合征集采购项目”
2024年12月26日,中央国家机关2024年度事务型数据库软件框架协议联合征集采购项目公布入围结果,GBase数据库全栈产品全部入围。