数据库 频道

Snowflake全力以赴,通过Lakehouse扩展吸引PostgreSQL开发者

  云数据平台供应商Snowflake将其PostgreSQL扩展套件开源,旨在帮助开发者和数据工程师将这款热门开源数据库与自家Lakehouse系统集成。

  Snowflake表示,pg_lake将使开发者和数据工程师能够直接从PostgreSQL读取和写入Apache Iceberg表,从而省去数据提取和迁移环节。Iceberg是一种开放表格式,其倡导者称该格式允许用户在不移动数据的情况下将其引入首选分析引擎;该格式得到Snowflake、谷歌、AWS等公司的支持。

  Snowflake产品执行副总裁Christian Kleinerman向《The Register》透露,开源该扩展将使采用PostgreSQL技术栈的开发者能够将数据库转化为管理开放式Lakehouse的接口。Lakehouse概念由竞争对手Databricks五年前提出,旨在描述能在单一系统上同时管理结构化(数据仓库)与非结构化(数据湖)工作负载的架构。

  Kleinerman表示:“开发者最常见的应用场景之一是基于PostgreSQL构建应用程序,随后将分析所需数据迁移或复制至Snowflake这类数据平台,或日益普及的开放式Lakehouse架构——例如AWS的S3 Tables中的Iceberg表,以及微软Fabric中的OneLake...这些数据由此实现分析价值。”

  这些扩展由PostgreSQL专业初创公司Crunchy Data开发,采用Apache许可证发布。该公司于今年6月被Snowflake以2.5亿美元收购。

  Snowflake软件工程总监Craig Kerstiens在博客中指出,pg_lake将通过引入新型Iceberg表类型实现PostgreSQL直接管理Iceberg表的功能,其中PostgreSQL充当目录管理器。开发者还可通过PostgreSQL直接查询数据湖中的原始数据文件、外部Iceberg表、Delta表及各类地理空间文件格式。

  Moor Insights & Strategy副总裁兼首席分析师Robert Kramer指出,为PostgreSQL用户提供无缝接入Snowflake Lakehouse架构与AI能力的通道,避免强制架构迁移,实属明智之举。

  “多数企业不会彻底弃用PostgreSQL——Snowflake对此有着清晰认知。pg_lake降低了PostgreSQL团队逐步采用Snowflake进行高价值分析和自动化的门槛,而非将其视为非此即彼的平台决策。我预计采用将呈渐进式增长,但长期来看会形成实质性牵引力,尤其当团队将运营数据库与受控AI执行环境融合时。”

  Snowflake同时宣布Snowflake Intelligence正式上线。这款AI智能助手据称能以自然语言解答复杂问题,让洞察力触手可及。其Horizon数据目录也进行了功能扩充。

  Kramer指出,Snowflake在规模扩展、监控能力及智能助手工作负载的实际成本方面仍需改进。

  “买家可能需要帮助理解Snowflake与Databricks及其他云平台的差异。Snowflake的设计初衷是打造一个能让AI可靠且负责任地运行的平台,而不仅仅用于测试。对于希望从AI实验转向实际运营的客户而言,这种理念至关重要。”

0
相关文章