技术开发 频道

OSDI '18重磅解密:蚂蚁金服实时金融级分布式图数据库GeaBase

  【IT168 评论】导读:GeaBase是具备高性能、高可用、高扩展性及可移植性强的实时金融级分布式图数据库。

  当地时间2018年10月8日-10日,全球计算机学界优异学术会议OSDI '18(USENIX Symposium on Operating Systems Design and Implementation,简称OSDI)在美国加州卡尔斯巴德举办。会上,阿里发表的主题为《GeaBase: A High-Performance Distributed Graph Database for Industry-Scale Applications》引发了大家的广泛关注。

  蚂蚁金服集团计算存储首席架构师何昌华

  图数据库——蚂蚁金服GeaBase

  近十年来,图数据库一直是业界关注的焦点,因为它非常善于处理大量的、复杂的、关联的、多变的网状数据,而且具备奇高的效率,可以说是为当前丰富、快速变化的互联网应用场景而生的,可广泛应用于社交网络、实时推荐、银行交易环路、金融征信系统等领域场景。

  2015年,蚂蚁金服成立了图数据库的技术团队,并成功研发出了具有高性能、高可用性、扩展能力强和较好移植性的图数据库——GeaBase。

  蚂蚁金服平台数据技术事业群高级算法专家付志嵩

  据蚂蚁金服集团相关技术专家介绍,GeaBase(Graph Exploration and Analytics Database)是蚂蚁金服完全自主研发的实时金融级分布式图数据库,不仅广泛应用于蚂蚁金服的生态体系内,而且已经商业化和技术对外输出,正与多家银行等企业开展合作。

  蚂蚁金服平台数据技术事业群高级技术专家肖涵

  GeaBase到底强在哪里?

  蚂蚁金服研发GeaBase的初衷是为了满足超大规模复杂关系网络在金融领域中的各类应用场景,既要支撑线上高并发、低延迟的实时查询需求,又要满足大规模模型训练的迭代运算。

  GeaBase的技术架构

  首先,GeaBase支持海量的数据。目前,GeaBase支撑着蚂蚁金服的多个关键应用场景,包括风控关系网络、资金关系网络,都达到百亿个节点、千亿条边的海量数据规模,其计算查询能力达到了非常高的水准。

  其次,GeaBase拥有非常强悍的在线查询性能,支持高并发,且具备毫秒级的低延时能力。通过与Titan的对比,无论是延时还是吞吐量,GeaBase的查询性能都领先许多。

  GeaBase还具备高可用的特性,其配置了多种容错机制,引入了多集群和多方位的监控体系,并配备了分布式架构的容灾方案。

  蚂蚁金服还为GeaBase研发了灵活且可扩展的查询语言。另外,为了和开源结合,GeaBase还将支持Gremlin图遍历语言。

  GeaBase的雄心:商业化和技术输出

  据了解,GeaBase现在支撑着蚂蚁金服旗下支付的风险控制、反洗钱、反欺诈、反刷单、反套现、金融案件审理、知识图谱、会员拉新、好友推荐、理财资讯推荐等众多的业务和应用。

  但GeaBase的雄心显然不止于此!目前,业界很多互联网公司也都在做图数据库方面的研究工作,但其中绝大多数都是基于自身系统的,因此具有较强的依赖性,剥离起来比较麻烦。而市面上已经商业化的图数据库又几乎都不是分布式的系统,其目标用户也主要是数据量较小的中小型企业。蚂蚁金服在设计之初就充分考虑了GeaBase系统移植的问题,因此,将其封装成产品,打造为高效易用的接入和管控产品化平台,GeaBase可以轻松地移植到外部客户的系统之中。

  据悉,目前已经有十余家银行有意向配置GeaBase,而且部分企业已经与蚂蚁金服签订合作协议。

  关于GeaBase的更多内容,请浏览蚂蚁金融科技官网:https://tech.antfin.com/

0
相关文章