【IT168资讯】2021年10月18日~20日,由IT168联合旗下ITPUB、ChinaUnix两大技术社区主办的第12届中国数据库技术大会(DTCC2021)在北京国际会议中心隆重召开。大会以“数造未来”为主题,设置20+技术专场重点围绕数据架构、人工智能与大数据应用、传统企业数据库实践等内容展开分享和探讨,天云数据受邀参加做“数据库之逻辑计划融合”主题分享。
从应用生产数据到人的行为生产数据再到机器生产数据,产业互联网的变革已经到来,这将带来巨大数据革命。生产资料发生变化,处理数据的规格、速度和多样性发生了变化,数据库不仅仅是支撑到30000亿记录数据库表的处理、SQL访问,还需要支持机器学习建模访问;不仅仅是支撑交易场景,还要支撑分析场景。所以需要一种新型的数据架构类型来支撑这个巨大的变革,天云数据资深售前孙岩从逻辑计划融合讲如何做数据底座。
什么是逻辑计划?
单纯的SQL是一个文本形式,需要经过解析、转换、优化等操作使数据库系统可以执行对应的SQL操作,我们把这一系列操作抽象为逻辑计划。同样图数据库也存在类似的操作,如图操作一般用gremlin语言进行操作,我们把其也抽象为逻辑计划。这样把一系列的关系表达、转换、解析等统称为逻辑计划,所以我们今天讲的逻辑计划是融合了SQL的逻辑计划、图的逻辑计划、AI的逻辑计划等多个逻辑计划的计划。
为什么要进行逻辑计划?
我们知道SQL作为数据库逻辑计划在数据库领域持续34年经久不衰,它功能丰富、使用方便灵活、语言简洁易学,因此深受计算机工业界和计算机用户的欢迎。但站在三十年后的今天,试问SQL真的就是数据库唯一的查询语言吗?物联网兴起,数据库凭着单一查询语言能否承载?
数据,可影响万物。数据库,作为数据的最佳载体,变得价值连城。互联网、物联网的发展一而再再而三的向数据库发出“新指令”,以Facebook为例,如果想很好地显示出你在Facebook的朋友圈中是否有影响力,你与朋友是否有着共同的兴趣爱好,关系型数据库就显得“无能为力”了。想呈现社会网络中人与人之间的关系,图数据库以其点和边关系的表达天然具有优势。尤其在错综复杂的数据关系环境,可谓一图胜过千言万语。因此,SQ作为数据库唯一的查询语言已经很难承载了,必须加入Graph逻辑计划,以应对物联网发出的“新指令”。
Hubble数据库如何支撑逻辑计划?
我们知道,业务场景分为两种模式,面向联机事务交易(OLTP)和面向联机分析(OLAP)。不管是关系型数据库还是图数据库都可以分为上面的两层业务逻辑。如果TP、AP业务在场景上是统一的,那么数据存储上就可以向上做兼容,满足同样的场景。因为Hubble数据库在设计之初就考虑了向上兼容性以及场景的复用,以抽象存储层、抽象计算层、抽象资源管理作为基础支撑,通过Hubble AP、TP的混合存储以及混合计算引擎,来支撑上层逻辑计划成为了可能。
Hubble数据库定义了基础底座,因此可以支撑上述场景的数据存储底座以及计算引擎,实现多条逻辑计划融合,保证一个库实现了所有场景的融合。一言以概之,Hubble数据库之所以能实现双引擎图数据价值,核心在于Hubble数据库底座足够强大。
首先,将图结构存储到Hubble数据库的存储层并复用了Hubble数据库的计算层、调度层;其次,通过SQL可以查看图结构的底层存储数据,方便问题排查;然后,兼容Gremlin语法,延续用户习惯。
Hubble数据库逻辑计划融合六大核心优势
1.主流语言开发接口
全部SQL标准,支持SQL99标准,封装多种查询调用接口,方便系统对接服务应用。
2.原生分布式架构
高效支撑数十亿条以上规模的网络关系分析,既可解决深度关联分析,又能提供实时答案。
3.高效支撑海量数据
动态高效的图数据存储策略,适合不同数据量级的图数据加载与计算。
4.数据可视化
图天然具有可解释性,可以更直观的展示数据之间、业务之间的关联关系,基于实体链路推理计算可以帮助企业挖掘各个业务实体的角色属性及关联关系。
5.多数据源动态切换
通过联邦技术能力接入各类数据库源系统,多数据源动态切换。
6.集成主流图算法
集成丰富的图计算算法,帮助企业利用知识图谱进行全图实体链路推理计算,构建基于业务应用的挖掘分析场景,提升企业在营销、风控等业务领域的智能服务。
Hubble数据库逻辑计划融合实践应用
某大型互联网数科公司,2.4亿活跃用户,供应链企业间关系错综复杂,通过Hubble数据库构建200亿+图数据库。进而发现金融供应链企业间的关联关系,利用风控部门管理客户并根据现有黑名单发现新的黑名单和多头贷企业,帮助企业建立自身完整的黑名单库。
某股份制商业银行信用卡反欺诈项目通过Hubble数据库将超过30万基础数据构建社交网络图,基于图谱网络实现32种关系构建,全行信用卡客户的近2.4亿条社交网络库,网络特征引入提升AUC值12%。
某证券公司迫切需要构建不同业务层面的勾稽关系网络,辅助证监会业务监管,通过Hubble数据库图谱节点总量8000万+,关系总量1.17亿+。同时可以预警资管产品风险和阻断资管产品风险,避免在风险发生后造成损失。
逻辑计划融合后Hubble数据库可以做什么?
当数据成为生产资料,智能成为新的生产力,人工智能原生数据库即AI-Native数据库将更好地放大一切商业模式,成为各行各业的基础设施。Hubble数据库通过逻辑计划融合SQL、Graph、ML等实现AI-Native数据库。
Hubble数据库TP、AP双轮驱动基础设施牢固,可以更好的支撑面向人工智能的数据库服务,支持原始数据特征工程和模型孵化训练以及模型的上线实时运营,为企业提供数字原生全产业服务链。