5月,数据库圈较为热闹,开源数仓Greenplum突然404;国家数据局发布承担数据标注基地建设任务的城市名单;Gartner Peer Insights报告发布,PingCAP、OceanBase、腾讯云入选;矩阵起源近日完成千万美元 Pre A 轮融资,全面拥抱AIGC;Snowflake 收购 AI 观测平台 TruEra;达梦数据开启新股申购,发行价86.96元/股;星环科技全面战略升级,为企业高效构建AI Infra……
市场动态
Greenplum突然404,有何影响?
近日,有网友反馈,开源MPP数据仓库Greenplum不能访问了,Greenplum原github主页显示404。Greenplum 源代码仓库的访问权限修改为了“只读”,同时还清空了原有的 branch、tag、pr、issue 等信息。目前Greenplum官网和Twitter没有发布任何消息,许多人猜测这可能意味着Pivotal公司计划将Greenplum闭源,尽管这一消息尚未得到官方确认,但已经引发了关注和讨论。
有专家表示,如果Greenplum闭源,可能会对Greenplum用户以及基于开源Greenplum构建产品的厂商带来影响,但是影响可能不会很大。
在用户侧,不少用户使用的Greenplum商业版。可能会促使用户寻求替代方案,此前的GP社区版用户已经有一些做了迁移。不过也有用户反馈现在使用的是GP社区版的稳定版本,对他们正常使用没有产生影响。
在厂商侧,基于开源Greenplum的数据库厂商,一般都做了分支,有二次开发能力,也可以支持其客户,这样影响会较低。如果基于GP的数据库厂商自身团队没有很好的技术储备,比较依赖GP社区,只是开源套壳,那么影响会很大。
专家认为,要想一个开源产品活得好, 需要开源和商业得到非常好的共生关系,只有这个开源产品背后的公司因为开源获得了更好的商业利益, 才能让该开源产品, 走向一个更好发展的状态。
国家数据局发布承担数据标注基地建设任务的城市名单
5月24日下午,国家数据局党组书记、局长刘烈宏在第七届数字中国峰会主论坛上发布了承担数据标注基地建设任务的城市名单,分别是:四川省成都市、辽宁省沈阳市、安徽省合肥市、湖南省长沙市、海南省海口市、河北省保定市、山西省大同市。七个城市承接了数据标注基地建设任务书。
国际数据库顶 级学术会议 ICDE 2024在荷兰举行
5 月 13 日-17 日,国际数据库顶 级学术会议 ICDE 2024 在荷兰乌得勒支举行,国内多家厂商的论文入选。
OceanBase 联合高校共同研究的三篇论文成功入选。本次 ICDE 2024 论文入选,标志着继 ICDE 2023 的死锁检测论文之后,OceanBase 在数据库领域科研创新的进一步突破。
腾讯云数据库2篇论文入选国际数据库顶 级会议ICDE。其分布式事务协议——Lion和内存-磁盘跨越索引设计框架,解决了数据库领域的普遍难题。
ICDE 与 SIGMOD、VLDB 并称数据管理与数据库领域的三大国际顶 级学术会议,入选为中国计算机学会(CCF)推荐的 A 类国际学术会议,在国际上享有盛誉并具有广泛的学术影响力。
Gartner Peer Insights报告发布
近日,全球信息技术研究与咨询机构 Gartner 发布了云数据库市场领域 2024 Gartner® Peer Insights™“Voice of the Customer” 报告,PingCAP、OceanBase、腾讯云入选,其中, PingCAP 获评「客户之选」,是唯一获得该称号的中国厂商,应该是国产独立数据库厂商第一次取得这样的成绩。
分区域来看,OceanBase、PingCAP、腾讯云入选亚太区“客户之选”象限。
Gartner® Peer Insights™ 是一个面向全球、专门针对企业级软件的客户评审和评级平台。客户可以根据使用经验对产品进行匿名评价,公开的评论都经过严格的验证和审核,代表着全球客户对数据管理的多维度需求,对于企业管理者和决策者来说更具参考价值。
矩阵起源全面拥抱AIDC,世纪互联领投千万美元Pre A轮融资
5月16日消息,矩阵起源近日完成千万美元 Pre A 轮融资,由世纪互联领投,Honour Base 跟投。本轮融资后,矩阵起源将在超融合异构数据库 MatrixOne 的基础上,扩展业务至 AI Infra 和 AI Platform 领域,并与世纪互联的 AIDC 业务深度融合和协作。
本轮融资将用于开发极简统一、开源开放的 AI-Native 数据智能全域操作系统 MatrixOS,该系统将由大规模异构算力纳管调度平台 MatrixDC、超融合异构数据管理平台 MatrixOne 和 AI智能体应用开发平台 MatrixGenesis 三部分组成,目标是打造链接算力、数据、知识、模型与企业应用的 AI Native 软件平台。
基于矩阵起源MatrixOS 和世纪互联最新的 AIDC 产品打造的 GPU 平台服务 neolink.ai,将在 2024 年 Q3 正式推出。
Snowflake 宣布收购 AI 观测平台 TruEra
近日,Snowflake 宣布达成协议,拟收购 AI 观测平台 TruEra ,以提升其 AI 数据云的功能和可信度。TruEra 平台可在生产环境中评估和监控 LLM 应用和 ML 模型,其技术有助于评估 LLM 应用的输入、输出和中间结果的质量,从而加速了广泛应用案例的实验评估,包括问答、摘要、检索增强生成应用(RAG 应用)和基于 Agent 的应用。
此次收购后,TruEra 的工程师和高管也将加入 Snowflake ,包括 TruEra 的三位联合创始人:总裁兼首席科学家 Anupam Datta、首席技术官 Shayak Sen 和首席执行官 Will Uppington。
达梦数据开启新股申购,发行价86.96元/股
5月31日,今日达梦数据开启新股申购,发行价86.96元/股,发行市盈率24.09倍。公司向大中型公司、企事业单位、党政机关提供各类数据库软件及集群软件、云计算与大数据产品等一系列数据库产品及相关技术服务。
产品与解决方案
数仓坚守者Teradata 投身Lakehouse
但在本月早些时候,Teradata 确认将支持Lakehouse,该概念结合了杂乱的数据湖和结构化数据仓库,以及在对象存储和开放表格式支持下随时随地进行分析的理念。
尽管Teradata可能是被逼无奈,但观察人士指出,Teradata的主打产品--基于块存储的高性能分析技术仍有用武之地。
这家拥有 45 年历史的公司此前宣布支持开放表格式(OTF) Apache Iceberg 和 Linux Foundation Delta Lake。通过这种方式,Teradata顺应了行业趋势,即对数据进行原位分析,而不是将数据转移到单一存储中进行商业智能和其他分析。
此前Teradata坚决不认可Lakehouse的概念。2022 年,时任首席技术官Stephen Brobst在接受The Register采访时说,数据湖和数据仓库是统一架构的一部分,但却是两个不同的概念。“原始数据(即真正的数据湖)和数据产品(即企业数据仓库)是有区别的。”他说。
Oracle Database 23ai 正式发布
日前,Oracle Database 23ai 正式发布。在过去四年中,Oracle 数据库开发部门一直在努力提供 Oracle 数据库的下一个长期支持版本,重点是 AI 和开发人员的工作效率。鉴于此版本数据库中对 AI 的关注,决定将数据库的名称从 Oracle Database 23c 更改为 Oracle Database 23ai。
Oracle Database 23ai 专注于三个关键领域:AI for Data、数据开发、数据关键任务。
MongoDB Atlas Vector Search与Amazon Bedrock集成已全面可用
MongoDB(纳斯达克股票代码:MDB)近日在2024 MongoDB用户大会纽约站大会(MongoDB.local NYC)上宣布,MongoDB Atlas Vector Search与Amazon Bedrock 在知识库上集成现已全面可用,这将助力组织更轻松地利用完全托管的基础模型 (FM) 来构建生成式AI应用程序功能。
“从初创公司到大型企业在内的各种规模的客户都开始利用生成式AI来构建激动人心的全新终端用户体验。然而,许多企业都对AI系统输出的准确性以及保障其专有数据的安全性表示担忧。随着MongoDB Atlas Vector Search与Amazon Bedrock集成的全面可用,MongoDB和亚马逊云科技的共同客户将可以更加便捷地使用托管于AWS环境中的各种基础模型来构建生成式AI应用程序。这些应用程序能够安全地运用MongoDB Atlas中的专有数据,在提高准确性的同时,改善终端用户体验。”MongoDB首席产品官Sahir Azam
星环科技Transwarp ArgoDB完成中国信通院多模数据库产品测试
5月9日消息,近日,在中国信通院组织的首批“可信数据库”多模数据库产品测试中,星环信息科技(上海)股份有限公司(简称:星环科技)Transwarp ArgoDB顺利完成多模数据库产品基础能力测试。测试过程依据标准在基本功能、运维管理、安全性、兼容性、扩展性以及高可用六大能力域的相关要求。测试结果表明,该产品在多模数据库的功能完备性、易用性、通用性等方面均符合标准要求。
每秒支持10000000级写入!达梦新云时序数据库应时而生
5月15日消息,达梦数据在官微发布了其NoSQL领域的最新动态。达梦新云时序数据库是由达梦数据自主研发的深度兼容TimescaleDB的分布式时序数据库,提供批流一体的数据实时处理引擎,兼容传统SQL、提供数据订阅、预警等内置引擎,可以有效支撑物联网和工业互联网、数字孪生、金融交易、业务监控和系统运维领域等多种时序数据业务场景。每秒支持10000000级写入。
Elastic 推出搜索 AI Lake 以扩展低延迟搜索
5月16日消息,Elastic 推出搜索 AI Lake 以扩展低延迟搜索,通过搜索 AI Lake,Elastic 提供了一种云原生架构,该架构针对低延迟应用进行了优化,包括搜索、检索增强生成(RAG)、可观察性和安全性。新服务能够在指数级大数据集上扩展搜索,以向量形式快速查询数据。
数据规模的快速增长催生了数据湖的出现,数据湖为任何规模的结构化和非结构化数据存储提供了一个集中存储库。数据湖架构通常将计算和存储分离开来,以实现处理大量数据的可扩展性和灵活性。 但是,这些架构通常将可扩展性置于性能之上,因此不太适合需要低延迟查询和访问所有数据的实时应用。为了帮助解决这个问题,企业搜索技术提供商 Elastic 推出了一种新的Lake架构。
大多数主要数据湖和Lakehouse供应商都使用一种或多种数据湖表格格式,如 Apache Iceberg 或 Databricks Delta Lake。不过,ElasticSearch AI Lake 并不使用这些表格格式。Search AI Lake使用Elastic Common Schema格式和Elasticsearch查询语言,以联合的方式在Elastic集群中探索数据。
Elastic Cloud Serverless和Search AI Lake目前处于技术预览阶段。
阿里云数据库 SelectDB 版全面商业化!开启现代化实时数据仓库的全新篇章
2024 年 5 月 21 日,由阿里云联合飞轮科技共同举办的「阿里云数据库 SelectDB 版商业化产品发布会」于线上召开。阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞宣布,阿里云数据库 SelectDB 版在中国站及国际站全面发布,正式开启商业化的全新篇章。
阿里云数据库 SelectDB 版是专为现代企业量身定制的实时数仓解决方案,植根于开源 Apache Doris 的坚实基础,却不止于此——深度融合云随需而用的特性,依托阿里云基础设施,构建起云原生存算分离的全新架构,面向企业海量数据的实时分析需求,提供极速实时、湖仓融合统一、简单易用的云上数仓服务。
早在 2023 年初,阿里云与飞轮科技开启战略合作,围绕实时数据仓库这一方向不断深耕,探索符合现代化实时数据仓库的新标准。
DBdoctor v3.2.0 版本发布,免费专业版License自助申请已上线
5月22日DBdoctor v3.2.0版本发布,免费专业版License自助申请已上线。新功能如下:
·索引推荐:汇总展示指定时间段内的索引优化DDL修复语句,展示每条索引优化推荐的分析详情和推导过程;
·新增存储分析,提供存储异常分析和未来趋势预测的功能; ·增加静态SQL审核的支持; ·增加根因推导过程的展示;
·新增对TDSQL的支持,支持达梦的性能洞察,支持PgSQL 12-14版本的性能洞察,PgSQL 10-14支持审计日志和锁透视功能,PgSQL 10-14和Oracle 19c增加基础监控和实例巡检;
·支持Mac一键拉起部署;
·实例诊断页面布局调整,按照事前诊断、实时诊断、实例调优的分类提供不同功能的导航。
TiDB 8.1 LTS 发版:夯实大型集群的稳定性和易用性,驱动业务融合和降低企业成本
5 月 24 日,TiDB 8.1 LTS 正式发布。 新版本通过一系列创新功能,增强了大型集群的稳定性和运维能力,尤其针对应用多租户功能和 SaaS 类型用户场景做了稳定性和性能的多方面增强。
作为 2024 年发布的第一个长期支持版本 (LTS),TiDB 8.1 着眼于提升大型集群的稳定性和运维能力。新版本中,TiDB 在可扩展性与性能、稳定性与高可用性以及可观测性等方面获得了持续的提升。TiDB 8.1 LTS 包含了已发布的 7.6.0-DMR 和 8.0.0-DMR 版本中的新功能、提升改进和错误修复。TiDB 8.x 开始着手一些复杂的架构改进,旨在进一步提升大型集群性能和稳定性,这些工作无法在一个 LTS 周期完成,因此我们在 v8.1 中看到了许多实验特性。同时,上一个 LTS 发布的大部分实验特性都已转为正式功能。
星环科技全面战略升级,为企业高效构建AI Infra
在5月31举办的2024向星力·未来数据技术峰会上,星环科技创始人、CEO孙元浩宣布,星环科技的定位从Data Infra进一步延伸到AI Infra,为企业客户打造AI基础设施,打造从语料处理、模型训练、知识库建设等的一整套的工具链,帮助企业快速建立行业大模型,快速使用AIGC。会上星环科技正式发布其最新人工智能基础设施产品Transwarp Knowledge Hub星环知识平台(以下简称TKH)、创新的语料开发工具星环语料开发工具TCS(Transwarp Corpus Studio),此外星环原有的TDH、KunDB、ArgoDB、图数据库、向量数据库等产品进行了更近升级。
星环科技新推出的产品可以让企业的数据底座实现四个一体化:湖仓集一体化、多模型处理一体化、历史数据与实时数据处理一体化、本地集群和云平台一体化。
The Others
海致星图图数据处理框架Laconic荣登VLDB顶会
5月7日消息,近日,数据库国际顶会VLDB2024公布新一批论文,海致星图和中国人民大学联合研发的图数据处理框架Laconic成功入围,该框架针对不同的图算法完成了低峰值内存的压缩和计算任务,为在资源受限环境下的图数据应用提供了新的解决方案。
新朋友+1!Zabbix与OceanBase完成兼容性认证
5月10日消息,近日,Zabbix 与 OceanBase 完成兼容性认证。经过严格联合测试,双方产品完全兼容,整体运行稳定高效,可共同打造高性能的运维监控解决方案,完全满足用户的运维监管要求。
目前,Zabbix 支持 OceanBase 作为后台数据库存储配置数据和历史数据,整体性能更优于 MySQL 数据库。
华为GaussDB与CCF启动新五年战略合作
5月24~25日,中国计算机学会(CCF)数据库专委会发起的SiftDB 2024(中国数据库发展战略研讨会)在广西南宁召开。SiftDB致力于探讨数据库领域的国际前沿研究方向,共商数据库未来发展大计,持续提升国产数据库应用水平。本次会议以“数据要素探索”为主题,汇聚了业内专家和学者,聚焦最新研究成果和行业热点,旨在通过高层次的学术和实践交流,促进国产数据库的发展。
在SiftDB 2024数据库战略研讨会上,华为公司学术发展部潘秋菱部长表示,华为公司从2001年开始数据库研发,华为也将与CCF数据库专委长期携手合作,在过往五年的基础上进一步加大投入,签署下一个五年战略合作框架协议,支持更多优秀学者开展前沿探索和研究,联合创新突破,为中国的数据库产业发展贡献力量,同时也给世界一个更优选择。