企业正在使用人工智能、预测分析和其他先进工具来收集和使用比以往更多的数据,希望能更深入地了解环境并做出更明智的战略决策。
然而,企业通常依赖传统的关系数据库来存储和管理数据。这些系统往往缺乏现代分析所需的可扩展性和灵活性。为了应对这些挑战,许多企业转而采用图技术来更好地映射数据中错综复杂的联系。
同时管理图和关系数据库在成本、时间和复杂性方面都具有挑战性。PuppyGraph 是一家位于旧金山的初创公司,由谷歌和 LinkedIn 的前工程师创立。
这家初创公司最近筹集了 500 万美元的种子基金,以推进其图查询引擎的发展。PuppyGraph 的Zero-ETL 引擎旨在让用户能够以统一的图的方式查询关系数据,从而不再需要单独的图数据库和耗时的提取、转换和加载(ETL)过程。
传统的 SQL 操作非常适合处理表格中的结构化数据,但在管理复杂和相互关联的数据时却显得力不从心。用户可能不得不依赖跨表和 ETL 管道的复杂 JOIN 操作,但这会大大降低查询和分析复杂数据集的效率。
PuppyGraph 的Zero-ETL 引擎旨在解决这一问题,使企业能够使用现有的 SQL 基础架构,同时访问图分析的高级功能。它通过整合关系数据库和图数据库的功能来实现这一目标。
用户可以在关系型数据的基础上执行基于图的查询。这样就无需学习新的图查询语言或重新设计现有系统。对于精通 SQL 并希望探索图分析的用户来说,PuppyGraph 允许他们使用熟悉的数据湖和工具进行数据准备、聚合和管理,从而简化了流程。
据 PuppyGraph 称,他们的引擎从部署到查询只需 10 分钟,能够扩展到 PB 级数据,并能在数秒内执行复杂的 10 跳查询。用户只需将其连接到数据源,然后引擎就会自动生成图模式,并将表格作为图进行查询。
PuppyGraph 成立于 2023 年,其使命是简化图分析。PuppyGraph 的创始人认识到在传统数据库中浏览复杂关系所面临的挑战,他们希望创建一种工具,消除对额外复杂性、成本和维护层的需求。
这家初创公司的名字来源于某个创始人的一只小狗,他们的想法是让图技术像小狗一样平易近人。
这家初创公司在成立后的一年内迅速扩大规模,目前已与 Dawn Capital、Clarivate、Prevalent AI、Coinbase 和许多其他企业合作。它还集成了流行的数据湖和仓库,如 Snowflake、DuckDB 和 AWS Redshift。
PuppyGraph 免费开发者版的下载量月环比增长 70%,反映了大家的普遍关注。这家初创公司还成为Databricks在Unity Catalog上的首个图分析合作伙伴。
Coinbase数据平台高级经理Eric Sun在2024年数据+AI峰会上对PuppyGraph的影响发表了评论:“PuppyGraph是一个非常有趣的图查询引擎。它不需要我们将数据加载或 ETL 到专有的图数据库存储层,我们可以直接查询数据湖中的所有数据--无论是Delta、Iceberg还是普通的Parquet文件。PuppyGraph 可以将这些数据整合到图模型和另一个分布式计算引擎中,以呈现所有结果。”
“我们将其与 Unity Catalog 结合使用,以解锁 Delta Lake 上的所有交易和加密数据。然后,PuppyGraph 直接查询这些数据,执行各种基于图的探索和聚合。这种功能非常强大,我们的用户非常喜欢这种灵活性。”
随着图数据库技术的成熟和普及,Gartner 预测,到 2025 年,市场规模将增长到 32 亿美元,复合年增长率(CAGR)将达到 28.1%。
PuppyGraph 已经有了一个不错的开端,但它还面临着来自 Tigergraph、AWS Neptune、Neo4j、ArrangoDB 和Aerospike 等产品的激烈竞争。有了新资金,PuppyGraph 计划扩大团队,加快产品开发,扩大全球影响力。