2024年首月,是继往开来的日子。PostgreSQL 被 DB-Engines 评为2023年年度数据库;我国首个图计算平台标准正式发布;《香港Web3.0标准化白皮书(2023)》正式发布;IDC预测,到2027年,数据和分析软件支出将以16%的复合年增长率增长,达到3400亿美元;首届阿里云PolarDB开发者大会召开……
市场动态
PostgreSQL 被 DB-Engines 评为2023年年度数据库
1月3日消息,开源数据库 PostgreSQL 今天被著名排名网站 DB-Engines 评为2023年年度数据库管理系统。
DB-Engines表示,PostgreSQL是2023年排名得分上升幅度最大的系统。PostgreSQL由麻省理工学Michael Stonebraker于1986年联合提出,这是十年来该系统第四次在排名平台上获此殊荣。
去年 6 月,根据 Stack Overflow 的一项大规模调查,PostgreSQL被评为最受开发人员欢迎的数据库引擎。调查发现,它被认为是 2022 年最受专业开发人员欢迎的数据库引擎。
我国首个图计算平台标准正式发布
2023年10月26日,根据《中国通信标准化协会团体标准管理办法》规定,经协会技术管理委员审核通过,中国通信标准化协会批准《C-V2X路侧直连通信网络覆盖性能测试方法》等42项团体标准,其中团体标准《大数据 图计算平台技术要求与测试方法》(编号:T/CCSA 470—2023)正式发布。该标准已于2024年1月4日在全国团体标准信息平台(https://www.ttbz.org.cn/StandardManage/Detail/100854/)备案。
图计算平台是指以图论为理论基础,以大规模点、边关系及其属性的数据为基础构造图结构,通过图计算框架对图进行特征分析、算法挖掘任务的数据处理平台。《大数据 图计算平台技术要求与测试方法》主要包括基本功能、兼容性能力、管理能力、高可用能力、扩展性能力五大项,总共34项测试用例,适用于图计算平台的设计、开发、测试及应用能力的评价与指导,可供各行业组织参考,也可以作为第三方评价机构衡量图计算平台及其应用能力的标准依据。
《香港Web3.0标准化白皮书(2023)》正式发布
1月4日,“数字经济发展新机遇峰会”在香港金融大会堂成功举办。本次会议发布了《香港Web3.0标准化白皮书(2023)》。白皮书由香港Web3.0标准化协会、香港理工大学、大湾区国际信息科技协会数字经济研究中心、IEEE计算机协会区块链和分布式记账标准化委员会联合51个单位的81位专家共同编写,涵盖背景和现状、认识和理解、技术和协议、金融和服务、标准化思路五个部分,以及128个Web3.0词汇和21个案例。
IDC FutureScape:2024年中国数据和分析市场十大预测
1月24日消息,IDC预测,到2027年,数据和分析软件支出将以16%的复合年增长率增长,达到3400亿美元,企业希望通过分析和运营加快从数据中获取价值并作出决策。尽管数据和分析技术已经存在并被利用了数十年,但Gen AI的出现和经典AI/ML的成熟为所有组织创造了一个充满期望和极大关注的环境。IDC DataSphere数据显示,到2027年,全球非结构化数据将占到数据总量的86.8%,达到246.9ZB。全球数据总量从103.67ZB增长至284.30ZB,CAGR为22.4%,呈现稳定增长态势。
十大预测包括数据评估、空间智能、数据智能、无头BI、内外一致性、产品迭代率、非结构化管理、向量和图管理、大模型本体、CDO任期。
产品与解决方案
MatrixOne内核1.1.0版本正式发布
1月初消息,日前,矩阵起源MatrixOne内核1.1.0版本正式发布,MatrixOne在本迭代增加了多个重要功能,在整体HTAP的基础上增强了向量,流和时序方面的能力,进一步丰富了能力象限和适用范围。
MatrixOne是一款分布式超融合异构数据库,MatrixOne旨在提供一个云原生、高性能、高弹性、高度兼容MySQL的HSTAP数据库,让用户面对事务、分析、时序、流计算等混合负载时,通过MatrixOne一站式的完成整个数据处理过程。
AWS 取消可扩展到零的Serverless Postgres 服务
1月8日消息,AWS 已通知其 Amazon Aurora Serverless v1 服务的客户,将于 2024 年底停止支持该服务。取代支持 Postgres 和 MySQL 数据库的 Aurora Serverless 系列 v1 服务的将是 v2,它具有一些优点,但也有一个很大的缺点:它不能将所有数据扩展到零。
AWS 于 2022 年 4 月发布的 Aurora Serverless v2 确实拥有 v1 所缺乏的几项功能,包括支持复制、逻辑复制,以及由于 AWS 一个多月前在 re:Invent 大会上发布的重大更新,可扩展至支持每秒百万次写入的全局数据库。
Aurora Serverless v2 还采用了 AWS 发布的新 RDS 数据 API,允许客户通过 REST 连接到 Aurora 数据库(目前仅支持 Postgres)。
然而,Aurora Serverless v2缺少Aurora Serverless v1中的一项重要功能:将规模缩小到零的能力。这让一些Aurora客户感到不解。
Bytebase 2.13.1发布,支持 Apache Doris
1月11日,Bytebase 2.13.1发布。新功能包括
支持 Apache Doris。
支持在对 MySQL 执行 DML 之前备份数据。
支持实例的最大连接数,用以控制每个实例的并·发任务数量。
支持对导出数据的压缩和加密。
深耕文档型数据库12载,SequoiaDB再开源
1月15日,巨杉数据库举行SequoiaDB新特性及开源项目发布活动。本次活动回顾了巨杉数据库深耕JSON文档型数据库12年的发展历程与技术演进,全面解读了SequoiaDB包括在高可用、安全、实时、易用性四个方向的技术特性,宣布了2024年面向技术社区的开源计划。
巨杉数据库自2011年研发内核、2012年公司成立,至2013年推出SequoiaDB v1.0版本,发布会介绍,巨杉数据库决定将在2024年Q1再次发布开源版本,希望通过开源的方式吸引更多合作伙伴,共同发展中国的分布式文档型数据库生态链,促进业务的快速迭代和开发效率的提升。近期,SequoiaDB新版本的源代码将通过Gitee、GitCode及GitHub再次开源。
SequoiaDB 也正在探索,为文档型数据库提供 「Vector Search 向量搜索」能力,为保存到 SequoiaDB 的向量数据,提供高效的查询能力,这一特性将在2024年与大家见面。
首届阿里云PolarDB开发者大会召开
1月17日,首届阿里云PolarDB开发者大会在京举办,云原生数据库PolarDB发布“三层分离”全新版本,基于智能决策实现查询性能10倍提升、节省50%成本。面向开发者,阿里云全新推出数据库场景体验馆、训练营等系列新举措,广大开发者可率先免费体验PolarDB数据库核心特性及NL2BI等AI新功能。
“在云原生加持下,我们持续挖掘AI新潜力,加速迈向智能化。以PolarDB为代表的云原生数据库,正在引领国产数据库换道超车,勇攀科技高峰,创造新一极。未来,个人开发者和企业用户可以像‘搭积木’一样开发和管理数据库,数据库的使用门槛将大幅降低,为云上AI创新的涌现夯实了基础底座。”阿里云数据库产品事业部负责人李飞飞表示。
据了解,PolarDB在过去3年实现400%的增速,目前用户数已超过10000家,广泛落地于政务、金融、电信、物流、互联网等领域的核心业务系统。
Databricks 推出通信数据智能平台
1 月 17 日,Databricks 发布了通信数据智能平台(Data Intelligence Platform for Communications),这是一个专为电信运营商和网络服务提供商量身定制的统一数据和人工智能平台。有了通信数据智能平台,通信服务提供商(CSP)将从统一的数据和人工智能基础中获益,并可在不牺牲数据隐私或机密 IP 的情况下,全面了解其网络、运营和客户互动情况。
通信数据智能平台基于开放式Lakehouse架构,将数据管理、数据治理和数据共享与企业就绪的生成式人工智能和机器学习(ML)工具相结合。
Cockroach Labs通过 v23.2 版吸引高端传统工作负载
1月18日,Cockroach Labs发布 CockroachDB 23.2 版本,以期更好地满足大公司高端负载需求。新版本使数据库更接近客户习惯的现有数据平台。首先,数据库的新物理集群复制功能有助于确保客户的数据得到保护。
CockroachDB 23.2 还重建了存储过程。该公司表示,PL/pgSQL 语言现在可以利用 CockroachDB 的分布式执行引擎,这意味着用户可以并行处理大量事务数据。
存储过程是供应用程序使用的数据库子程序。例如,在甲骨文和 IBM 的 DB2 等成熟的企业数据库系统中,通常用于访问控制。Cockroach Labs的首席产品官Nate Stewart说,存储过程方面的工作是公司计划的一部分,目的是为涉及企业工作负载迁移的项目提供更好的支持,而不是专注于新建实施。
虽然 Stewart 特别指出 IBM Db2 数据库可能会将某些工作负载迁移到 CockroachDB,但他很快强调:“大型机不会消失。”
阿里云在海外市场推出系列AI大数据产品
1月30日,阿里云在新加坡举行AI大数据峰会,面向海外市场发布一系列AI计算及大数据产品,涵盖serverless模式的AI服务平台、整合向量引擎技术的大数据产品等,以满足海外企业及开发者对AI模型开发和应用的多样需求。
PAI-EAS平台支持用户将模型一键部署为在线推理服务或AI-Web应用。此次新发布允许用户按需动态使用计算资源,免去管理和维护物理服务器或虚拟服务器的成本。
基于大模型的企业级检索增强生成(RAG)系统,通过联通垂直数据库、公共搜索,确保大语言模型生成更新、更准确的内容。
面向分析的企业级 SaaS 模式云数据仓库MaxCompute新增两个产品规格,其中MaxCompute(Spot)相对于标准版作业具有更低的单价,至高可节省约66%的计算成本,弹性预留CU实现更少的成本提升预留资源的满足率。
阿里云的Serverless Starrocks在新加坡区域发布。同时,EMR Serverless Starrocks 推出存算分离版本,实现存算分离的架构升级。
PAI-QuickStart产品,基于开源模型支持零代码实现从训练到部署再到推理的全部过程,
同时,阿里云联合多家全球ISV生态伙伴启动云上AI生态联盟。目前,阿里云在全球29个地域运营88个可用区。
The Others
某云原生、分布式、全栈国产化银行核心业务系统投产上线
1月5日消息,日前,杭州银行新一代核心业务系统成功投产上线。新核心系统是业内首个实际投产的云原生、分布式、全栈国产化的银行核心系统,是金融科技领域突破关键核心技术应用的重大实践。数据库采用TiDB,在新核心的开发和设计过程中,杭州银行没有对业务架构进行大量改造,实现了业务逻辑的平移。
第三届OceanBase数据库大赛圆满收官
1 月 6 日,2023 全国大学生计算机系统能力大赛暨第三届 OceanBase 数据库大赛(简称大赛)在华东师范大学落下帷幕,自启动以来,共吸引来自海内外 268 所高校的 2561 人报名,并组成 1154 支参赛队伍。从小而全的 MiniOB 到工业级分布式数据库 OceanBase,摸爬滚打中逐步探索数据库内核,展开一场关于理论与工程的实战较量。共有 1 支队伍荣获特等奖、2 支队伍荣获一等奖、3 支队伍荣获二等奖、4 支队伍荣获三等奖、10 支队伍荣获优胜奖。
滴普科技联合南方科技大学成立「“Data+AI”数据智能实验室」
1月10日,「“Data+AI”数据智能实验室」签约暨揭牌仪式在南方科技大学(简称南科大)举行。该实验室由南方科技大学统计与数据科学系携手北京滴普科技公司联合建设,旨在围绕大模型在AI Agent智能体的优化实践,研究解决领域模型在微调工程最 佳实践、大模型的可控安全等难题,通过大模型横向课题研究、技术社区共建、教学实践等手段,落地验证大模型的业务价值,加快科技创新成果转化,共同推进产学研高质量发展。