当地时间5月4日,SAP宣布将收购数据集成与分析服务提供商Dremio,旨在将其数据分析和AI代理构建工具的应用范围扩展至外部数据源。
这家ERP巨头斥资(具体金额未披露)收购了Dremio,获得其基于Iceberg的湖仓(Lakehouse)业务,旨在帮助客户消除数据碎片化并提升集成能力。据SAP称,此次收购将与其数据仓库及分析平台Business Data Cloud以及SAP HANA Cloud形成互补。
SAP在声明中表示,Business Data Cloud将转型为“原生支持Apache Iceberg的企业级湖仓一体平台,统一SAP与非SAP数据,为大规模企业级代理式人工智能(Agentic AI)提供动力。”
Apache Iceberg是一种源自Netflix的开放式表格式,其竞争对手是Databricks的Delta Lake格式(由Linux基金会开源),不过自Databricks收购Iceberg原始作者所创立的公司Tabular以来,该数据巨头已着手提升这些标准的互操作性。这两种格式都承诺将分析功能直接带到数据所在之处,无需耗费成本和精力进行数据迁移,从而为企业分析、机器学习及AI代理开发提供支撑。
SAP声称Apache Iceberg是业界标准的开放式表格式,而Business Data Cloud将原生支持该格式“作为其基础”,这意味着无需进行数据迁移或格式转换。
SAP此前曾有过类似举措。大约三年前,时任首席技术官Juergen Mueller曾承诺,借助与数据湖及机器学习供应商Databricks的合作,帮助客户“轻松且自信地将SAP数据与来自第三方应用和平台的非SAP数据进行集成”。
去年,SAP深化了与Databricks的合作,以支持SAP Business Data Cloud与第三方数据平台之间的双向数据共享,并以Databricks的Delta Lake开放表格式“作为初期交付方案”。该方案采用了Databricks的Delta Sharing功能,该功能最初基于Delta格式,不过Databricks最近已宣布支持Iceberg。
Dremio在2022年的一轮1.6亿美元融资中估值达20亿美元,无论SAP为收购该厂商花了多少钱,显然其认为获得基于Iceberg开放表格格式的更多技术是物有所值的,公告中多次强调了这一点。这或许会让一些人疑惑,SAP此前与Databricks的合作,究竟未能满足其哪些需求?
SAP表示,Dremio湖仓平台将“大幅提升企业分析的经济效益”,提供一种Serverless且弹性化的方案,无需预配置固定容量,也不受性能上限限制。
通过此次收购,SAP将为客户提供基于Apache Polaris和开源Apache Iceberg REST目录API构建的开放目录,为SAP Business Data Cloud创建发现与语义层。该平台承诺提供“统一业务上下文的单一访问入口:包括含义、关联关系、访问权限及数据血缘”,覆盖SAP系统外的企业数据。
