数据库 频道

Databricks 收购AI驱动的 BladeBridge 以简化数据迁移

Databricks 收购了专门从事企业数据仓库迁移解决方案的初创公司 BladeBridge,从而扩大了其产品组合。此次收购旨在帮助企业从亚马逊Redshift、Snowflake和Teradata等20多个数据仓库轻松迁移到Databricks SQL。

这家总部位于旧金山的大数据公司计划利用此次收购将BladeBridge技术与自己的平台整合,增加人工智能驱动的ETL功能,以简化和加速企业数据仓库迁移。交易的财务条款尚未披露。

BladeBridge 平台的一个关键优势是,与传统迁移工具不同,它使用大型语言模型(LLM)在转换前自动执行代码评估。通过优化这一过程,可以更快、更高效地将数据迁移到Databricks SQL 中。

企业正在快速更新传统数据仓库,以采用 Databricks SQL。在过去的一年里,Databricks SQL 创造的收入增长了 150% 以上,超过了 6 亿美元的运行速度。Databricks 还表示,其总收入有望超过 30 亿美元。

Databricks 联合创始人兼首席执行官 Ali Ghodsi 认为,Databricks SQL 的快速增长凸显了其对数据仓库领域的变革性影响。他说:“Databricks SQL 是市场上增长最快的数据仓库。由于 Databricks SQL 的性价比和人工智能创新,已有超过一万家企业选择了它。”

“随着越来越多的公司选择Databricks作为开放、灵活数据架构的基础,我们希望让从传统数据仓库向数据智能平台迁移变得比以往任何时候都更容易。通过与 BladeBridge 团队联手,我们可以帮助每家企业加快向 Databricks 迁移的速度,大大降低迁移成本和工作量。”

BladeBridge 开发了四种工具来简化数据迁移过程。其中包括分析器、转换器、数据重组模块和Studio工具。分析器检查当前数据库,在旧系统和 Databricks 上测试查询。它会创建一份详细报告,说明迁移的复杂程度,并强调需要解决的任何问题。

分析完成后,转换器会自动将数据从其原始格式转换为可与 Databricks SQL 协同工作的格式。据 BladeBridge 称,如果转换的任何部分失败,该平台可以自动调整设置,并不断重试,直到转换成功。

数据重建功能通过检查源数据集和新数据集之间的任何不一致之处来验证数据迁移的准确性。Studio 工具用于简化数据的上载,自动生成数据转换资产。

“在BladeBridge,我们的目标是为希望实现数据堆栈现代化的公司解决令人沮丧的挑战,如今我们已经帮助数百家企业成功迁移到云数据平台。”BladeBridge联合创始人兼执行副总裁Simon Eligulashvili表示。“我们很高兴能加入Databricks团队,继续我们的使命,帮助企业更快、更大规模地实现数据现代化目标。”

在过去两年中,Databricks进行了一系列战略收购,以建立其数据和人工智能业务。2023 年 7 月,Databricks 以 13 亿美元的价格收购了 MosaicML,震惊了大数据世界。由于MosaicML在2022年底的收入仅为100万美元,行业观察家猜测Databricks出价过高。

去年 3 月,Databricks 还收购了初创公司 Lilac AI,该公司销售用于管理非结构化数据集的工具,为人工智能模型提供数据支持。去年晚些时候,Databricks 又收购了 Apache Iceberg 背后的公司 Tabular。Databricks 向 BigDataWire 证实,这笔交易的估值超过 10 亿美元。此次收购旨在解决 Iceberg 与 Databricks 自己的 Delta 格式不兼容的问题。

Databricks 上个月获得了 150 亿美元的新资金和 52.5 亿美元的信用贷款,因此急于探索提高收入的新途径。该公司计划将资金投入到新的人工智能产品、收购和国际市场业务拓展中。

收购 BladeBridge 不仅能让客户更轻松地迁移数据,还反映了 Databricks 的发展历程。Databricks 最初是一个简化大数据处理的平台,后来发展成为一个全面的数据智能平台。

此外,这也表明了Databricks在针对竞争对手客户方面采取了更加积极的策略。BladeBridge更为人所知的是其将数据从过时和老旧系统迁移到现代系统的能力。至于客户是否会利用该平台从现代数据平台(如Snowflake)迁移到Databricks,仍有待观察。

0