数据库 频道

Databricks斥资13亿美元买入AI初创公司MosaicML:一场关于数据库未来的竞争

  Databricks为何不惜高价收购MosaicML,应该如何看待?

  最近Databricks宣布斥资高达13亿美元收购生成式人工智能初创公司MosaicML,这引发了行业内的一场轩然大波。

  MosaicML主打生成式AI平台,这家刚刚起步三年的初创公司,由两名前英特尔高管Naveen Rao和Hanlin Tang创立,公司规模不大,仅62名员工,却卖出高价肯定是有原因的。

  MosaicML发布了两款开源大型语言模型——MPT-7B和MPT-30B,尤其是上周发布的MPT-30B,在H100上完成了8k上下文长度的训练,性能优于原始GPT-3 ,让其名声大噪,其客户就包括Oracle等业界巨头。

  这次交易不仅彰显了当前人工智能市场的火热程度,同时也是云数据库市场正在发生剧变的一个信号。在更大的背景下看,Databricks与Snowflake的竞争一直如火如荼。

  有意思的是,Databricks与Snowflake竟在同一天举办了自己的2023年度大会,其实,国外公司卷起来一点不比国内逊色。而且两家公司的大会主题都与AI有关。Snowflake邀请了NVIDIA的CEO黄仁勋,而Databricks则请来了微软的CEO萨蒂亚·纳德拉。

  显然,两家都在争夺成为新一代的数据云,这无疑是企业市场的最大金矿。赢得这个市场,意味着成为企业最优数据存储中心以及数据科学和ML/AI工作的平台。

  为了赢得这个竞争,Databricks和Snowflake都在提升他们的ML/AI能力。

  其中,Databricks历来都有自研的ML/AI产品,最近甚至发布了自家的大模型——Dolly。同时,也与Dataiku这样的龙头ML/AI合作伙伴建立了深度的合作关系。

  除了自研和合作伙伴关系,Databricks和Snowflake都在通过收购来提升自身的实力。Snowflake去年斥资8亿美元收购了Streamlit,并在今年以1.5亿美元的价格收购了AI搜索公司Neeva。Databricks的收购历史也同样令人关注,其中以本次对MosaicML的收购最为引人瞩目。

  Databricks以高价收购MosaicML,无疑是其向非关系型数据库市场发起了一次强烈的冲击。更深层次的含义可能是,Databricks试图通过MosaicML来彻底改变处理数据的方式,甚至可能重新定义传统的关系型数据库。

  "神经网络模型可以被看作是一种数据库,尤其是在我们谈论生成模型的时候",MosaicML的联合创始人兼首席执行官Naveen Rao在交易达成前的一次访谈中这样表示。

  他进一步解释说,"从更高的视角来看,数据库就是一套高度结构化的端点,通常包含某种数据的行和列,然后,基于这些数据,我们就有了组织这些数据的模式(schema)。"

  Rao提到,与像Oracle这样的传统关系数据库或MongoDB这样的文档数据库不同,这些数据库的模式是预先设定的。而对于大型语言模型,"模式是从数据中挖掘出来的,它基于数据生成一种隐含的表达,它是灵活的。" 查询也是灵活的,这与SQL这样的固定查找方式不同,SQL在传统数据库中占主导地位。

  "所以,从根本上来说,你只是让数据库的输入、模式和输出更加灵活,但它依然是一个数据库。"Rao补充说,"在大型语言模型的形式下,这种数据库可以处理那些传统结构化数据存储难以处理的大数据。"

  总体上,这场收购折射出整个行业对于生成式AI技术和云数据库技术的高度重视。MosaicML的神经网络模型可能会对传统数据库产生深远影响,将会引领数据库技术朝着更加智能化和灵活化的方向发展。

  然而,这一切是否能如期实现,关键还在于Databricks如何融合并应用新收购的技术,以及市场是否会接受这种可能颠覆性的改变。

0
相关文章