12月17日,Databricks宣布获得J轮融资,该公司预计将进行100亿美元的非稀释性融资,迄今已完成86亿美元的融资,估值达620亿美元。
本轮融资由Thrive Capital领投,Andreessen Horowitz(最近投资了 11x 和 Valon)、DST Global、GIC、Insight Partners和WCM Investment Management共同跟投,其他一些现有投资者也参与了本次投资。
Databricks是何方神圣?为什么能够获得如此天价融资?
Databricks何以受到资本市场青睐?
Databricks将自己定位为一家Data+AI公司,以简化数据处理和人工智能应用为使命,因其应对现代数据基础设施挑战的能力而备受全球瞩目。
去年9月,Databricks在I轮融资获得5亿美元融资,投后估值430亿美元。由于市场兴趣浓厚,Databricks分配额和估值迅速上升。据路透社报道,本次融资,11月中旬,交易额有望达到80亿美元左右。几天后,交易价格为95亿美元,估值 600 亿美元。而到了本周二,交易价格达到100亿美元,估值620亿美元。本轮融资比OpenAI在10月份的66亿美元融资额还要高。
“本轮融资获得了大幅超额认购,我们非常高兴能邀请到一些对我们的愿景深信不疑的全球最知名的投资者。现在仍是人工智能发展的初期。我们将Databricks数据智能平台定位为为客户提供长期价值,我们的团队致力于帮助各行各业的公司建立数据智能,”Databricks联合创始人兼首席执行官Ali Ghodsi说,“我们正在构建变革性的数据和AI基础设施,很高兴能积极为客户服务,帮助他们取得成功。”
Insight Partners董事总经理George Mathew表示,大规模融资的背后是对处理下一代AI应用基础设施日益增长的需求。企业级数据管理、分析和人工智能系统的需求呈指数级增长,这为Databricks发挥的重要作用提供了支撑,所以J轮融资的市场需求旺盛。
Databricks在本次融资中披露了最新的经营数据,展示其良好的发展势头:
截至 2024年10月31日的第三季度收入同比增长超过 60%;
预计在截至 2025年1月31日的第四季度收入将突破 30 亿美元,并实现自由现金流正增长;
非美国通用会计准则订购毛利率继续保持在 80% 以上;
拥有 500 多家年收入超过 100 万美元的客户;
公司的智能数据仓库产品 Databricks SQL 的收入达到 6 亿美元,同比增长超过 150%;
Databricks声称其良好的发展势头得益于一年来的全球业务扩张。为了继续为全球客户提供服务,Databricks 宣布在伦敦建立新的欧洲区域中心,在新加坡建立亚太和日本(APJ)区域中心,并扩大在拉丁美洲和中东的业务。
被Ali Ghodsi如此看重的数据智能平台是Databricks因应GenAI时代推出的新一代平台,为了快速抓住GenAI时代的机遇,加快产品技术布局,有充足弹药的Databricks采取了一个豪横的策略:买买买!
买买买,加速打造数据+AI基础设施
Databricks于2013年由来自加州大学伯克利分校AMPLab的七名研究人员——Ali Ghodsi、Matei Zaharia、Reynold Xin、Ion Stoica、Patrick Wendell、Andy Konwinski和Arsalan Tavakoli-Shiraji组成的团队在美国创立。
最初,Databricks在云中实施Apache Spark,它在提供Spark所擅长的大规模数据处理方面一直表现出色。2020年,Databricks提出了Lakehouse概念,Lakehouse架构将数据湖存储(通过对象存储)的可扩展性优势与传统仓库或分析数据库的数据质量优势相结合。这一年底,Databricks推出了自己的数据仓库产品Databricks SQL,并迅速成为Snowflake的主要竞争对手。
近几年,开放表格式成为Lakehouse的新战场,Apache Hudi、Apache Iceberg和Databricks的Delta在开放表格式的竞争中一直处于三足鼎立的局面。在独立软件供应商和一些云巨头的大力支持下,Iceberg已成为领先的开放表格式,三足鼎立的局面正在改变,Databricks也提供了对Iceberg的支持。
自大模型引爆了新一轮AI革命以来,企业级数据管理、分析和人工智能系统的需求呈指数级增长,自去年以来,Databricks通过多次收购,加速Data+AI布局,向着自己的愿景方向努力。
2023年5月,Databricks 宣布收购了 Okera,这是一个专注于 AI 的数据治理平台。Okera 使用了一个AI驱动的系统,能够自动发现和分类个人身份信息,同时采用了一个无代码界面。此次收购使得Databricks能够公开更多API,供其数据治理合作伙伴使用,从而为客户提供解决方案。
2023 年 6 月,Databricks 达成了以 13 亿美元收购MosaicML的协议。此次收购增加了一个平台,使用户能够使用自己的专有数据训练和保护生成式AI模型,这与完全使用公共数据训练的模型不同,这些模型可以为商业决策提供信息。
2023 年 10 月,Databricks 宣布以1亿美元收购Arcion。该供应商的工具增加了数据摄取和数据复制功能,可用于开发管道,为生成式AI模型和应用提供素材并对其进行训练。
2023年12月,Databricks收购了AI初创公司Einblick,以提高其生成式AI能力,进一步体现了对生成式AI的重视。
2024年6月,Databricks 宣布收购Apache Iceberg表格式背后的商业机构Tabular,为Databricks客户在其Lakehouse环境中享受更多的统一性和更少的不兼容性铺平了道路。
去年,Databricks 推出了数据智能平台(Data Intelligence Platform),这是Lakehouse平台(Data Lakehouse Platform)的下一个演进版本,也是其实现愿景的关键。
Databricks官网对数据智能平台(Data Intelligence Platform)的描述如下:
“Databricks数据智能平台(Data Intelligence Platform)让您的整个组织都能使用数据和人工智能。它建立在Lakehouse之上,为所有数据和治理提供一个开放、统一的基础,并由一个数据智能引擎提供动力,该引擎能够理解您的数据的独特性。
每个行业的赢家都将是数据和人工智能公司。从 ETL到数据仓库,再到生成式AI,Databricks 可帮助您简化并加速实现数据和人工智能目标。”
有分析称,新的数据智能平台反映了该公司的重点,即让生成式AI与其长期以来的数据管理能力一样,成为其产品组合的重要组成部分。数据智能平台一旦完成,将把Lakehouse等数据平台与分析和数据科学结合起来。
小结:未来可能还要买买买
多年来,技术投资者一直在期待Databricks的IPO。去年收购Einblick时Ghodsi说,Databricks本可以走一条更传统的路线,在2021年的IPO热潮中上市,但是Databricks选择了专注于研发和并购。一些投资者预测,在经历了2021年底以来的相对缩紧之后,2025年科技公司的首次公开募股将变得更加频繁。Ghodsi在11月举行的峰会上透露了新的IPO动态:“如果我们要上市,最早也要等到大概明年年中的时候。”
实际上IPO只是一个结果,不论什么时候IPO,支撑Databricks未来发展的还是在于其技术产品和业务经营。
这些年Databricks与Snowflake这位老对手的竞争态势越来越明显,而GenAI时代,打造数据智能的道路上也会引来更多的竞争者。天价融资、业务高速增长这些市场的认可为Databricks带来更多底气,可以在GenAI时代的激励竞争中进一步积累自己的优势。
Ali Ghodsi在收购Einblick时就曾指出,对Einblick团队的收购是公司“不对称战略”的一部分。Ghodsi解释说:“我们已经筹集了40亿美元的资金,可以在并购方面进行大量投资,同时在世界其他地区进行扩张,而其他所有公司都做不到这一点,他们正面临着紧缩和裁员。”
如今获得100亿美元融资后,Databricks又有了充足的资金去买买买。据悉,本次J轮融资后,Databricks将把这笔资金投入到新的人工智能产品、收购和国际市场业务的大幅扩张中。除促进公司发展外,这笔资金预计还将用于为在职和离职员工提供流动资金,以及支付相关税费。
文章参考Databricks、TechCrunch等