本篇案例来自我们对某B2B营销公司的嘉宾采访,本文为《图数据库选型指南》选题的系列文章之一,在此特别感谢受访嘉宾刘老师对我们的支持。
本文将重点讨论该营销公司在图数据库方面的需求,选型时考虑的因素以及建议等,希望能为大家带来启发。
图数据库是关系型数据库的补充
一个公司可能会用到多种数据库,该嘉宾表示,基本上每个公司都会用到关系型数据库,但是在一些复杂关联关系查询时,关系型数据库的性能可能会比较差,图数据库是关系型数据库的很好的补充。此外,图数据库可以集成到大数据平台和分布式系统中,来处理大规模的图数据和一些高并发负载。整体来看,图数据库和其他类型的数据库还是一个相互补充和协作的关系。
图数据库在B2B营销的一个典型应用场景是潜在客户推荐,帮助企业分析已有客户信息,构建客户画像,利用图数据库的相似性算法推荐与现有客户类似的潜在客户。这可以帮助企业提高获客能力,尤其是在拓展新行业、新领域时,会有很大的帮助。
图数据库主要用来表达实体和实体之间的关系,该B2B营销公司的实体主要围绕企业的一些相关信息。包括企业的人、企业本身,企业下面的门店,以及企业招投标信息等与企业相关的信息。由于需求明确,以及公司对图数据库有较深的理解,该公司成立不久就应用了图数据库构建企业图谱。
起初,该公司选择了开源图数据库ArrangoDB,ArrangoDB是一个多模图数据库。随着业务增长,ArrangoDB已经无法满足其需求,该公司选择了某国产开源图数据库进行升级。
选型:图数据库选型关注哪些因素?
该B2B营销公司在进行图数据库选型时,最关注以下三个方面。
一是,成熟度。看社区的支持和维护程度,文档的完善程度等,比如ArrangoDB社区已经不是一个特别活跃的社区。它的一些文档、维护支持都不是特别好。
二是,周边生态包括一些工具的支持。图数据库周边生态工具和集成支持也特别重要,比如是否可以提供可视化工具,是否有一些开发者工具,以及与其他工具和技术的集成能力,这样能提高开发和使用的效率。
三是,性能、功能等方面,比如扩展性等。
选型建议:如何选择一个合适的图数据库?
要选择一个合适的图数据并不容易,该嘉宾给出了以下建议:
首先,要进行需求调研,包括对数据结构、查询需求、性能等需求的调研。明确需求才能识别出来要选什么样的图数据库,因为不同图数据库存在差异。有时候调研可能会发现,图数据库未必是一个最好的选择,关系型数据库就能解决很多的问题,此时,为了降低复杂度,可能都没有必要用图数据库。
二是,考虑数据模型和查询语言。现在图数据库的查询语言并不像关系型数据库那样统一,图数据库查询语言并不标准,虽然标准图查询语言就要发布,但是目前还是各自为战,查询语言在具体应用的时候是比较关键的,需要重点关注。
三是,定好需求、数据模型和查询语言后,做一个小范围数据的测试,综合评估一下图数据库的性能、功能还有易用性。大家往往会比较关注性能,但是有的功能如果不能满足,还需要进行二次开发,二次开发带来的成本很高,可能比性能问题带来的成本还要高。
未来展望:如何与大模型结合?
目前,该B2B营销公司并没有将所有的数据录入到图数据库中,只录入了部分实体、关系。未来,可能随着业务发展的需要,会把越来越多的数据录入到图里。另一方面,会探索与大数据平台相结合,利用不同的算法进行数据挖掘,挖掘更多的数据价值。
此外,随着AIGC的火热,大家也在探索图数据库与大模型的结合点。该嘉宾指出,通过图数据库构建的知识图谱,是能够做一些精准查询的知识库,在查询特定知识的时候,知识图谱的精度普遍要比通用大模型更优。知识图谱是企业高质量的私有数据,通过知识图谱可以对大模型进行微调和训练,最终出来的垂直领域的行业大模型效果会更好。知识图谱能给大模型提供价值,也不会被大模型替代,图与大模型的结合值得探索。