数据库 频道
  • 理解RAG之融合检索与重新排序

    经典RAG与融合检索之间的关键区别在于如何处理和整合检索到的多个文档以形成最终响应。在经典的RAG中,检索到的文档内容只是简单地串联起来,或者最多是抽取式摘要,然后作为额外的上下文输入LLM以生成响应,不涉及高级融合技术的应用。而在融合检索中,则使用更专业的机制来跨多个文档组合相关信息。这种融合过程可以发生在增强阶段(检索阶段)或甚至是在生成阶段。

    任朝阳 · 2025-04-23 10:45
  • AI能让专家经验复用变得更简单

    大多数时候,大模型也仅仅能够依靠告知它的专家经验去做重复性的工作而已,并没有表现出我们期待的特殊能力,不过这样已经足够了。能够让专家经验通过这种方式被积累下来,并且能够自动重用,已经是AI运维应用上的一个突破了。

    任朝阳 · 2025-04-23 10:41
  • OODBMS和图数据库在数据建模方面的区别

    在数据库技术不断发展的过程中,OODBMS(面向对象数据库管理系统)和图数据库之间的选择对于数据建模变得越来越重要。本文深入探讨了这两种方法的主要区别,探讨了它们在处理关系、复杂对象和互连数据方面的独特优势和局限性。

    任朝阳 · 2025-04-22 11:20
  • DB-Engines排名:Snowflake和PostgreSQL快速提升

    Snowflake数据库是3月份排名上升幅度最大的数据库,在过去六个月中有四个月都出现在排名上升幅度最大的数据库之列,并且还是2024年度的数据库管理系统。该平台之所以受欢迎,很可能是因为其创新的基于云的架构,这种架构为数据仓库和分析提供了可扩展性、高性能以及易用性。

    任朝阳 · 2025-04-21 15:12
  • IDC预计,2028年中国大数据总体市场规模将超621亿美元

    国际数据公司(IDC)近日发布了2025年V1版本《全球大数据支出指南》(IDC Worldwide Big Data and Analytics Spending Guide)。IDC最新数据显示,2024年全球大数据IT总投资规模约为3,540亿美元,2028年预计接近6,441亿美元,五年复合增长率(CAGR)约为16.8%%。

    任朝阳 · 2025-04-21 13:56
  • 数据库可观测性中的指标与TRACE

    开放OWI不是简单的给用户开放一个接口那么简单。让一些原本需要TRACE的数据常态化输出,是需要在数据库内核上做巨大的调整才能够实现的。目前国产数据库在这方面的技术水平差距还是不小的,作为一个DBA,我也希望国产数据库在这方面能够投入更多的研发成本,尽快向Oracle看齐。

    任朝阳 · 2025-04-18 10:40
  • ChatBI是数据分析灵丹妙药还是伪需求?

    随着GPT、DeepSeek等AI的走红,“对话即分析”成为新潮流,“用自然语言提问,AI自动生成数据分析结果”即ChatBI(对话式BI)凭借这一概念迅速成为企业数字化转型的焦点。各厂商纷纷押注这一赛道。但与此同时,质疑声也不断涌现:ChatBI究竟是解放生产力的工具,还是资本包装的“空中楼阁”?

    任朝阳 · 2025-04-18 10:28
  • 不容忽视的 MCP 安全问题

    目前,Anthropic 的多代理上下文协议 (MCP) 备受关注。MCP 通常被称为“AI 代理的 USB-C”,它承诺将标准化代理之间的通信方式。

    任朝阳 · 2025-04-16 15:33
  • DeepSeek燃起AI热潮,企业如何实现AI Ready?

    随着DeepSeek在IT领域掀起热潮,迎来以DeepSeek为代表的AI淘金热。数据技术如何因应AI带来的变革?企业如何实现AI Ready?

    任朝阳 · 2025-04-15 17:07
  • AI时代,DBA的技能会有有哪些改变

    实际上在目前阶段以及未来很多年里,AI都会成为人类的强大助手,就像当年计算机帮助人一样。我建议年轻的DBA,去积极拥抱AI,尽快去构建自己的AI助手,用它帮你提高效率。

    任朝阳 · 2025-04-15 10:05
  • 在项目中实施 NoSQL数据库的 3 个优势和挑战

    深入研究 NoSQL 数据库的世界,会发现既有优势也有挑战。本文通过行业专家的智慧,揭开了其中的复杂性,并提供了清晰的路线图。从实时分析到移动社交网络,您将获得有关 NoSQL 如何改变技术各个方面的深刻见解。

    任朝阳 · 2025-04-14 14:16
  • 这才是真正的数据驱动决策,而不是拍脑袋

    经常有新手同学问:数据分析到底是怎么驱动决策的?今天用一个通俗的例子,让大家看清楚数据驱动决策全流程。

    任朝阳 · 2025-04-14 11:36
  • 谷歌云在Next 2025大会着眼AI时代强化数据库产品

    谷歌云在其Next 2025大会上推出了很多重大的数据库增强功能,包括AlloyDB中的一系列新人工智能特性、Firestore的兼容MongoDB的应用程序编程接口(API)、BigTable中的连续物化视图、大量的模型上下文协议(MCP)连接、新的数据库迁移服务,以及在其云端引入甲骨文的Exadata数据库。

    任朝阳 · 2025-04-11 15:26
  • 蚂蚁集团等:GraphRAG技术综述

    大语言模型(LLMs)在自然语言处理领域取得显著进展,但存在缺乏领域知识、信息更新不及时和 “幻觉” 等问题。检索增强生成(RAG)通过引入外部知识改进 LLMs 输出,但传统 RAG 在处理文本关系以及全局信息提取方面有一定局限性,难以突出相互之间的影响。为此,本文提出的GraphRAG 则利用图数据库的结构信息,更精准全面地检索,提升回答的准确性和相关性。

    任朝阳 · 2025-04-11 14:28
  • Snowflake 加强对 Apache Iceberg 表的支持

    Snowflake 今天推出了一系列针对 Apache Iceberg 的增强功能,Apache Iceberg 是其去年添加到数据平台的开放表格式。其中最大的亮点是,Snowflake 客户可以像对待原生的 Snowflake 内部表一样对待 Iceberg 表,从而有效地消除了双层系统。

    任朝阳 · 2025-04-10 14:03
  • LLM数据分类分级:降临的"神器"还是"伪需求"?

    各大厂商、技术大会都在鼓吹用LLM能彻底革了我们那套靠正则表达式和关键字硬撑的数据分类分级体系的命。有趣的是,LLM在数据分类分级领域,就像一辆新能源汽车——很酷、很想要,但多数企业真实的需求可能只是一辆电瓶车。

    任朝阳 · 2025-04-10 10:10
  • 从DB-Engines排名攀升看TiDB全球突破之路

    一批数据库新势力以创新谋发展,在智能化这场大变革中发挥越来越重要的作用。近年来,我们看到成立至今已十年的原生分布式关系型数据库TiDB在全球排名不断攀升,成绩斐然,以TiDB为代表的数据库新势力正展露头角,书写新的历史。

    任朝阳 · 2025-04-10 09:21
  • CDO 的价值要求:通过 Agentic AI 推动业务影响

    如今,CDO 需要做的不仅仅是谈论 AI 驱动的决策,他们必须让其发挥作用。否则,他们可能会陷入与之前许多人相同的陷阱:大规模的 AI 投资永远不会转化为商业价值。

    任朝阳 · 2025-04-09 11:38
  • 数据库选型和数据库应用已经是两股道上的车了

    这两年是数据库国产化替代的重点年份,很多不太想动的用户也开始有所动作了。我最近和一些国产数据库用户沟通的时候,大多数听到的都是他们的使用心得,对于选型方面的关注反而少了不少。

    任朝阳 · 2025-04-08 15:23
  • 从数据仓库到Lakehouse:DBA 的机遇与挑战

    Lakehouse和数据仓库在现代数据架构中取得了一定的成功,但数据湖的出现为数据库管理员(DBA)带来了新的挑战和机遇。这对 DBA 及其职业生涯有何影响?随着数据湖使用范围的扩大,他们的角色将如何演变?让我们来探讨Lakehouse时代 DBA 的概念、挑战和机遇。

    任朝阳 · 2025-04-08 10:04