11月,安全可靠测评工作指南(V2.0)发布;IDC发布RAG与向量数据库市场前景预测;《Forrester Wave™: Translytical Data Platforms, Q4 2024 》市场报告发布,中国两家企业入选;PuppyGraph 获 500 万美元投资推进Zero-ETL 图查询……
市场动态
安全可靠测评工作指南(V2.0)发布
11月26日,中国信息安全测评中心发布了《安全可靠测评工作指南(V2.0)》,指南指出,安全可靠测评主要面向计算机终端和服务器搭载的中央处理器(CPU)、操作系统以及数据库等基础软硬件产品,通过对产品及其研发单位的核心技术、安全保障、持续发展等方面开展评估,评定产品的安全性和可持续性,实现对产品研发设计、生产制造、供应保障、售后维护等全生命周期安全可靠性的综合度量和客观评价。
(申请条件)
测评申请的受理期受理期每年两次,为1月第一个工作日至2月最后一个工作日和7月第一个工作日至8月最后一个工作日。
送测单位可通过中国信息安全测评中心(网址:www.itsec.gov.cn)和国家保密科技测评中心(网址:www.nsstec.org.cn)官方网站查询测评结果,测评结果自发布之日起有效期3年。
未通过测评的产品,如在供应链安全、核心技术掌控、知识产权、抵御安全风险等方面取得重要进展,可在受理期内重新申请送测。两次未通过测评的,两年内不再受理其同类产品测评申请。
IDC发布RAG与向量数据库市场前景预测
11月1日消息,IDC于近日发布了《RAG与向量数据库市场前景预测》,当前,RAG与向量数据库是AI厂商布局的重点方向之一。2023年全球非结构化数据占比达到92.9%,用户需要更好地管理、治理这些数据从而用于更精准的分析和AI内容生成。
在生成式AI开发过程中,41%的高管认为搭建RAG架构非常重要,81%的IT领导者认为利用自己业务数据的GenAI模型将使他们比竞争对手具有明显优势。RAG为LLM提供企业内部数据,使生成内容更加准确合理,已在知识问答、对话查询、任务执行等应用中集成。未来两年,企业表示将在营销、网络安全、知识管理和发现等领域中更多采用RAG。
原生向量数据库、向量检索引擎作为实现RAG的重要组成,最先落地的客户和场景包括银行(客服、知识库)、制造业(故障检测)、汽车(知识库、图片相似性搜索)、搜索(相似性搜索)等。从需求来看,大部分客户对RAG和向量数据库的区别还没有明确认知,更多从成本和难易程度的角度来考虑建设方式,同时随着文档数量的上升,也更关注如何组织逻辑、评估效果。
向量数据库市场主要由GenAI带动,多为大模型服务项目总包中的一部分,仅有少量商业化解决方案落地,例如银行保险行业,2024年各企业在向量数据库项目上的营收规模大多集中在3000-5000万,其整体市场也面临着RAG开源检索引擎、LLMOps工具的影响。
《Graph+AI:大模型浪潮下的图计算》白皮书正式发布
11月2日,在全国智能计算标准化工作组2024年度全体会议上,由蚂蚁集团和之江实验室牵头,依托全国智能计算标准化工作组图计算研究组制定的《Graph+AI:大模型浪潮下的图计算》白皮书正式发布。
这份白皮书深入探讨了图计算与人工智能的融合,特别是在大规模模型的背景下的融合发展。白皮书讨论了图数据处理、图神经网络和知识图谱工程等尖端技术,以及Graph+AI在各个领域的实践应用。
《Forrester Wave™: Translytical Data Platforms, Q4 2024 》市场报告发布
11月20日消息,近日,全球知名的独立研究机构 Forrester Research 发布了《Forrester Wave™: Translytical Data Platforms, Q4 2024 》市场报告,对全球的 Translytical Data Platforms(事务分析型数据平台)供应商进行了全面的评估,依据 26 项严格标准筛选出 15 家主流供应商。其中,PingCAP和OceanBase入选“竞争者”象限。
报告指出,传统的数据平台在满足不断变化的业务需求方面面临困境,尤其是在实时数据处理、极致可扩展性、低延迟访问关键信息和数据安全性方面。Translytical Data Platforms(事务分析型数据平台)是下一代数据解决方案,基于单一数据库引擎构建,能够无缝支持事务性、操作性和分析性工作负载,而不牺牲数据完整性、性能和实时分析能力。事务分析型数据平台还提供对分布式数据架构、多模能力、生成式 AI、机器学习、向量搜索、云集成和高级工作负载管理的支持。随着实时洞察、可扩展的微服务、生成式 AI 和高吞吐量事务处理等新兴业务需求的增加,事务分析型数据平台的应用正在迅速增长。
IDC发布《2024年上半年中国关系型数据库软件市场跟踪报告》
11月26日,IDC最新发布的《2024年上半年中国关系型数据库软件市场跟踪报告》显示,2024上半年中国关系型数据库软件市场规模为19.3亿美元,同比增长10.7%,较2023下半年情况有小幅回升。其中,公有云关系型数据库规模12.9亿美元,同比增长14.1%;本地部署关系型数据库规模6.4亿美元,同比增长4.2% 。
IDC预测, 由于软件国产化以及宏观经济复苏的影响,中国关系型数据库市场将在2025年重新恢复到25%以上的高速增长。到2028年,中国关系型数据库软件市场规模将达到97.6亿美元,2023-2028的5年市场年复合增长率(CAGR)为20.8%。
PuppyGraph 获 500 万美元投资推进Zero-ETL 图查询
11月11日消息,PuppyGraph这家初创公司最近筹集了 500 万美元的种子基金,以推进其图查询引擎的发展。有了新资金,PuppyGraph 计划扩大团队,加快产品开发,扩大全球影响力。
PuppyGraph 的Zero-ETL 引擎旨在让用户能够以统一的图的方式查询关系数据,从而不再需要单独的图数据库和耗时的提取、转换和加载(ETL)过程。
用户可以在关系型数据的基础上执行基于图的查询。这样就无需学习新的图查询语言或重新设计现有系统。对于精通 SQL 并希望探索图分析的用户来说,PuppyGraph 允许他们使用熟悉的数据湖和工具进行数据准备、聚合和管理,从而简化了流程。
Cloudera通过收购 Octopai 加强数据目录和元数据管理
企业数据云解决方案提供商 Cloudera 已同意收购 Octopai 的数据血缘和目录平台。收购预计将于本月底完成。此举大大增强了 Cloudera 的数据目录和元数据管理能力。
Cloudera 的目标是利用 Octopai 平台将分散和复杂的数据转化为统一和可信的基础,以促进战略决策、创新和合规性,从而解决目前企业数据分散的状态。
Snowflake宣布收购Datavolo,深化企业AI数据服务
11月21日, Snowflake宣布已签署一项最终协议,将收购Datavolo。Datavolo是一家致力于快速加速企业AI的多模态数据管道创建、管理和可观察性建设的公司。
通过此次收购,Snowflake将在数据生命周期的“原始数据层”深化其服务,并为数据工程团队提供一个简单的方法,将他们的所有企业系统集成到Snowflake的统一平台上。在那里,他们可以解锁数据以供AI和机器学习(ML)、应用程序和分析使用,并利用AI数据云的规模、性能和内置治理。Datavolo和Snowflake将共同简化数据工程工作负载,并提供良好的数据互操作性和可扩展性,这是有效企业AI的基础。
产品与解决方案
EDB宣布致力于获得 FedRAMP 授权
11月1日,Postgres数据和人工智能公司EnterpriseDB(EDB)宣布,计划获得联邦风险和授权管理计划(FedRAMP)授权,该计划建立在其为1500多家企业客户提供安全、合规解决方案的坚实基础之上,这些客户包括众多政府和公共部门组织,其中包括与国防部和司法部(DOJ)相关的组织。
FedRAMP为所有联邦机构提供标准化的云安全方法,满足国防部环境中保护受控非机密信息(CUI)和国家安全系统(NSS)的特定需求。随着 EDB 向这一授权迈进,它寻求加强对国家安全倡议的支持,并通过安全、合规的解决方案增强公共部门组织管理和分析敏感数据的能力。这将进一步推动政府和公共部门主权数据和人工智能解决方案的发展。
ClickHouse 24.10 版本发布
11月8日消息,ClickHouse 24.10 版本发布,本次ClickHouse 24.10 版本包含了25个新功能、15项性能优化、60个bug修复。新版本clickhouse-local 更加实用,新增了复制和计算器模式。可刷新物化视图已达到生产就绪标准,远程文件支持缓存,表克隆操作也得到了简化。
悦数图数据库 v5.0 及悦数 RAG 正式发布
11 月 7 日,杭州悦数正式推出了悦数图数据库 v5.0 及悦数 RAG 两大全新产品。 悦数图数据库 v5.0 原生支持 GQL ,多项创新实现了性能提升,基于 3 节点集群的测试数据显示,v5.0 版本实现了突破性的提升:查询性能提升达 6.4 倍,总体查询吞吐量(QPS)提升超过 3 倍,同时系统内存占用大幅降低,节省近 90% 的内存资源。
悦数 RAG 凭借其“零门槛”的应用构建能力,非技术人员也能通过简单的三步操作,快速创建企业级知识应用——定义数据源、配置应用规则、发布应用。
Elastic 通过 AutoOps 集成简化 Elasticsearch 管理
11月7日,Elastic宣布,Elastic收购Opster后推出的监控和管理工具AutoOps现已完全集成到Elastic Cloud中。Elastic Cloud用户现在可以访问简化的集群管理,包括性能建议、资源利用率和成本洞察、实时问题检测和解决路径。
AutoOps对Elastic Cloud用户免费,有了 AutoOps,Elastic Cloud 用户将能够:
体验大幅简化的 Elasticsearch 管理,利用量身定制的 Elastic 利用率和配置洞察力减少管理时间。
检测和预防 Elasticsearch 特有的问题,实时监控数百个弹性指标,预先配置警报,以检测摄取瓶颈、数据结构配置错误、负载不平衡、查询速度慢等问题。
通过深入分析问题发生的时间点,获得根本原因分析和解决建议,包括上下文中的 Elasticsearch 命令。
获取 Elasticsearch 部署的成本可见性和优化建议,以提高资源利用率。
Elastic 宣布建立人工智能生态系统,加速 GenAI 应用开发
11月15日,Elastic宣布推出人工智能生态系统,帮助企业开发人员加速构建和部署其检索增强生成(RAG)应用。Elastic AI生态系统为开发人员提供了一套经过精心策划、与Elasticsearch向量数据库集成的综合AI技术和工具。
Elastic AI 生态系统包括与阿里云、AWS、Anthropic's Claude、Cohere、Confluent、Dataiku、DataRobot、Galileo、谷歌云、Hugging Face、LangChain、LlamaIndex、微软、Mistral AI、英伟达、OpenAI、Protect AI、RedHat、Vectorize 和 Unstructured 的集成。
OushuDB 6.0发布:为实时湖仓注入强大动能
11月8日,OushuDB 6.0 正式发布,新版本发布包含了众多关键功能和性能提升:
OushuDB 6.0 引入了新的 HORC (Hudi ORC) 存储引擎,并增加了动态分区功能,为用户带来了更灵活、高效的存储解决方案。
OushuDB 6.0 完成了体系架构线程化和协程化,相比之前的进程架构,线程化让查询启动更加轻量级,不仅大幅提升实时场景性能,还在多线程和高并发场景下提升了吞吐量与响应速度。
OushuDB 6.0兼容了 PostgreSQL 和 Greenplum 高版本语法,包含数十项语法的兼容性。只要是与Greenplum和PostgreSQL语法兼容的数据库,OushuDB都可以帮助用户实现平滑替换,并更好的支持当下愈发复杂的数据应用。
OushuDB 6.0 打破了 Hash 表并行度固定的局限,引入了基于 Cache Locality 的调度算法。通过这一算法,OushuDB 能够根据查询的具体情况动态调整并行度,以便更高效地利用多核处理器和分布式硬件资源,优化了查询性能,提升了 OushuDB 的易用性。
OushuDB 6.0 支持多租户隔离,除了层级租户隔离,还支持租户间计算资源与数据资源的隔离,以及可视化级联权限管理。多租户隔离的升级,增强了平台的数据安全性和隐私保护,简化了用户管理流程,提高了管理效率。
Apache Doris 2.1.7 版本正式发布
Apache Doris 2.1.7 版本于 2024 年 11 月 10 日正式发布。2.1.7 版本持续升级改进,同时在湖仓一体、异步物化视图、半结构化数据管理、查询优化器、执行引擎、存储管理、以及权限管理等方面完成了若干修复。
Snowflake Intelligence涉足代理人工智能领域
11月12日消息,Snowflake在今天举行的Build 2024用户大会上发布了一系列消息,其中包括Snowflake Cortex AI中由生成式 AI驱动的新功能--Snowflake Intelligence,该功能允许客户根据与数据的对话和其他交互构建代理式AI应用程序。
Build 2024 产品发布会的亮点可能是 Snowflake Intelligence,它是 Snowflake Cortex AI 产品线的新成员。Cortex AI 是Snowflake一年前推出的人工智能服务,让用户可以在云中运行一系列由大型语言模型(LLM)驱动的任务,其中包括:被称为 Document AI 的对话界面,让用户可以使用自然语言对非结构化数据提问;被称为 Cortex Search 的基于检索增强生成(RAG)的搜索引擎;以及文本到 SQL 生成器 Cortex Analyst。
深算院崖山发布核心平替战略
2024年11月14日,由深圳计算科学研究院(简称:深算院)主办、深圳崖山科技有限公司(简称:崖山科技)和赛迪网承办的“2024国产数据库创新生态大会”在深圳成功举办。会上,崖山数据库重磅发布“专为核心场景打造的1:1平替方案”战略,同期推出崖山共享集群战略级产品、数据库一体机、数据库云服务等系列新品。
会上深算院首席产品官兼崖山科技副总裁王南重磅发布YashanDB V23.3版本,该定位为面向企业核心的全场景数据库,具备1:1平替Oracle的能力,同时新发布数据库一体机、数据库云服务两种产品形态。
大会现场,王南重磅宣布YashanDB共享集群全面开放,用户可在YashanDB官网免费下载体验。同时,YashanDB联合中小企业协会金融科技分会、长亮科技、天源迪科、高伟达、金证科技、瑞银科技、华为、浪潮集团、迪思杰、新数科技、云和恩墨、中软国际等产业上下游企业启动“金融核心替代技术创新生态共建行动”计划
DBdoctor v3.2.4.3版本发布,新增对openGauss、Vastbase G100的支持
11月18日,DBdoctor v3.2.4.3版本发布,新引擎扩展: 新增对Vastbase G100数据库的支持:支持对Vastbase G100数据库的SQL审核、实例巡检、性能洞察、锁透视、根因诊断、审计日志、基础监控、索引推荐、存储分析;
功能优化: 新增支持PostgreSQL 15版本;新增PostgreSQL、Oracle参数管理功能:快速感知并查看数据库各配置参数的变更历史;
微软SQL Server 2025 将全面进军AI领域
11月19日消息,微软数据库战马 SQL Server 的新版本即将发布,在AI支持方面做了升级。 SQL Server 2025 的新特性将是性能和可用性的增强,这些增强来自 Azure SQL。根据微软发言人的说法,该版本将优化锁定、可选参数计划优化、更快的批处理模式和列存储索引。此外,还支持 REST API,并启用了正则表达式。
SQL Server 2025 内置了AI,利用 T-SQL 语言,通过安全、高性能和易用的向量支持,简化了人工智能应用程序开发和检索增强生成(RAG)模式。
如果说SQL Server 2022是为了让一切都 “支持 Azure”,那么 SQL Server 2025 则反映了微软对AI的痴迷。“SQL Server 2025 将 SQL Server 转变为企业级 AI 就绪数据库,以安全、高效的方式为客户的数据带来 AI。”发言人说。
最新版本SQL Server 2022的主流支持将持续到2028年1月11日,扩展支持将持续到 2033 年 1 月 11 日。这位发言人告诉我们,SQL Server 2025 很可能会遵循微软的固定生命周期政策,在五年的主流支持期之后再提供五年的扩展支持期。
嬴图Powerhouse全面发布
11月27日消息,嬴图Powerhouse全面发布,它是嬴图自2019年发布高密度并行图计算引擎以来的一个里程碑,对整个产品架构的进行了彻底革新。嬴图Powerhouse基于C++实现,采用了全新的超融合架构,由Shard服务器、HDC服务器、Name Server服务器以及Meta服务器四大主要部分组成,具备高性能图计算能力和弹性的可扩展性。2024年嬴图先后入选英国FinTech Global“DataTech50 for 2024”排行榜和ESG FinTech100榜单。
The Others
谷歌新人工智能工具发现 SQLite 中的关键零日漏洞
随着网络威胁日益复杂,对创新工具的需求空前高涨,以加强漏洞检测。Palo Alto、Fortinet 和 CrowdStrike 等网络安全公司已经采取应对措施,将人工智能用于增强威胁检测能力。 一项新的网络安全创新令人惊讶。谷歌声称,它已经使用一个名为 “Big Sleep ”的大型语言模型(LLM)代理发现了SQLite 数据库(一种广泛使用的开源数据库引擎)中一个以前未知的、可被利用的内存漏洞。
现有的 SQLite 测试基础设施,包括项目自身的基础设施和 OSS-Fuzz 都无法发现该问题。零项目团队利用 Big Sleep 发现了预发布版本中的漏洞,并立即通知了 SQLite 团队。该漏洞在同一天得到修补,防止了任何潜在的利用。
这并不是人工智能驱动的工具第一次发现软件中的漏洞。今年 8 月,一个名为 Atlantis 的 LLM 程序在 SQLite 中发现了一个不同的漏洞。多年来,机器学习(ML)模型也一直被用于发现软件代码中的潜在漏洞。
达梦分布式数据库DMDPC顺利完成HyBench基准测试
近期,达梦分布式数据库DMDPC顺利完成了HyBench 的全面基准测试,并在测试中表现优异。达梦分布式数据库DMDPC率先完成1500X数据量规模测试,获得H-Score评分值379.45。
HyBench 是国内首个基于在线交易风控场景的 HTAP 数据库测试基准,由中国软件评测中心(工业和信息化部软件与集成电路促进中心)、清华大学联合牵头,达梦数据、OceanBase、华为、腾讯云、阿里云共同研发。HyBench 旨在引导数据库技术的发展方向,提升产品性能,并为企业的数据库选型提供重要参考。这不仅是国际上评价数据库产品的通用做法,也是推动我国数据库产业创新发展、技术进步的重要手段。
万里数据库入围四川省2024年基础软件框架协议采购项目
近日,四川省2024年基础软件(数据库管理系统、中间件、操作系统、办公软件)框架协议采购项目继公开征集后发布入围结果公告。公告显示,万里安全数据库软件V1.0入围第二包——集中式数据库。此次标包2入围厂商中,万里数据库也是唯一一家基于MySQL技术路线的数据库厂商。