数据库 频道

阿里云Tair究竟何方神圣?

  近期,Gartner公布了2020年度全球云数据库魔力象限评估结果,阿里云表现极为亮眼,首次挺进全球云数据库第一阵营——领导者(LEADERS)象限,这也是中国数据库40年来首次进入全球优异数据库行列。

  在云数据库赛道上,其营收已经跃居全球第三,在中国市场份额也首次超过了Oracle。

  

  众所周知,阿里云数据库在OLTP、OLAP板块实力强劲,有自研的PolarDB和ADB(AnalyticDB)形成双品牌。去年在第六届世界互联网大会上,PolarDB当选世界互联网领先科技成果。最近,又斩获了2020年中国电子学会科技进步一等奖。而AnalyticDB在今年中旬获浙江科技进步一等奖,并在TPC-DS打榜成绩第一。

  那么,问题来了,阿里云数据库有没有短板呢?有,就在NoSQL板块,阿里云缺乏一个强劲的品牌产品,但这个短板在Tair和Lindorm出现后,将成为过去式。

  12月13日,老鱼受邀参加了由阿里云主办的2020云内存数据库峰会暨Tair大赛颁奖典礼,这是阿里云首场线下云内存数据库峰会。

  参加这场活动的原因是出于好奇。“Tair”是什么?,这是一个陌生的名字。更关键的是,在此次主要参会嘉宾名单中,老鱼看到了阿里云智能数据库NoSQL产品线总经理的名字。

  Tair、内存数据库、NoSQL产品线,这其中有什么关联?

  Tair是什么

  会后,老鱼在采访阿里云数据库负责人李飞飞时了解到,“Tair”是一个品牌,阿里云自研云原生内存数据库品牌,后续该品牌将会正式商业化,其归属于NoSQL产品线。

  阿里云智能数据库NoSQL产品线包含2大核心产品,分别是云原生多模数据库Lindorm,云原生内存数据库Tair。

  实际上“Tair”在阿里集团诞生已经有十余年,2004年,淘宝开始应用缓存技术。最先投入应用的是基于前端页面的缓存技术,采用ESI来标识可以加速和不能加速的网页内容片段,有效减少了从服务端抓取整个页面的次数。

  随着淘宝网的流量快速增长,数据库的压力与日俱增,基于后端系统的缓存技术应运而生。从服务淘宝详情和验证码等业务的持久化系统TBStore,到初始服务于淘宝用户中心的TDBM等等,后端系统缓存技术经历了多个系统和阶段的演变与积累,到2009年,这些系统、技术经验经过进一步的研发,融合成了阿里巴巴大规模高速存储系统Tair。

  基于这个阿里集团内部使用的Tair产品研发的云上托管键值对内存服务,就是阿里云自研云原生内存数据库Tair,(又称Redis企业版),100% 兼容开源社区版的 Redis。

  如今,基于Tair演进的Redis企业版已经是阿里巴巴集团调用量最大的系统之一,在多年的阿里巴巴双十一全球狂欢节上提供了核心的在线访问加速能力,承受住了每秒数亿次的调用。

  Tair商业价值

  阿里云为什么要做Tair?其商业价值何在?李飞飞在演讲中说的很清楚。

  先看传统内存数据库面临哪些挑战?

  第一、成本的挑战,内存是所有存储组件中最贵的一部分,这个不用多说。

  第二、弹性能力的挑战,传统内存数据库很难根据业务的波峰、波谷变化来实时调整或者使用,弹性部署不同容量的内存,弹性能力是受限的;

  第三、多模数据的挑战;对半结构化、非结构化丰富计算模型多模的计算处理能力是客户的需求。

  第四、企业级能力;

  再看趋势,2020年全球数据规模40ZB,2025年全球数据规模相比2020年会有爆炸性的430%以上的增长。

  2025年实时数据占比30%,2022年,50%的新业务将会采用实时分析。

  其中一个关键的变化是非结构性数据占比会大大提升,非结构化数据占比将会高达50%以上,同比增速也会到50%以上。

  基于以上数据,并结合数据上云的趋势,阿里云得出一个结论:

  在传统针对结构化数据的关系型数据库市场之外,一定会有一个更大的针对半结构化非结构化数据的非关系型数据库的市场,并且这个市场很大的挑战是如何将半结构化、非结构化数据的处理实时在线化。

  这就是今天,为什么阿里云打造云原生实时在线的多模数据库Lindorm,会结合最新的硬件,如傲腾(Intel AEP),去打造下一代Tair内存数据库的原因。

  要解决以上挑战,仅仅靠软件层面、算法层面的突破是不够的。这也是李飞飞谈到解锁存算一体,实现真正的存储计算在内存层面一体化的背后逻辑。

  Tair产品选择

  从产品类型及特性来看,Tair又分为三个不同形态的产品,分别是性能增强型、持久内存型、容量存储型。其区别主要在存储介质上,分别是DRAM、Intel AEP、ESSD云盘。对应的是客户选型的3大核心指标:访问延时、持久化需要、整体成本。

  性能增强型,适合以满足业务性能需求为主的客户,如数据读写频繁,要求低延迟,支持大连接,对成本相对不敏感。

  从官方给出的数据,吞吐达到开源Redis的2倍以上,热点访问能力数十万每秒,能同时支撑30~50K并发连接。

  持久内存型,适合对延迟和吞吐有近乎内存的需求,整体存储数据量又比较大,持久化,成本控制较内存更高的客户。

  从官方给出的数据,其性能近似内存,具备有内存90%的吞吐能力,而成本降低35%。

  容量存储型,适合数据读写密集程度低,延迟要求相对不高,存储容量要求高的客户,成本是最大考量因素。

  从官方给出的数据,On ESSD的版本成本最低可达到全内存版本的15%,容量可达到百T级别,并且解决了开源Redis固有的Fork问题而不得不预留部分内存的问题。

  很显然,在云内存数据库上,阿里云给予了客户更多选择,并切入了一个新兴的市场。基于AEP和自研内存引擎,并结合神龙裸金属服务器推出的Tair持久内存版本。在目前看来,是其他竞争对手不具备的。

  Gartner报告指出,具有前瞻性眼光,并且愿意为产品持续投入,拥有丰富的数据库种类覆盖度和完善的产品布局,能解决客户各种应用场景需求,是阿里云数据库能够成为市场领导者并能够引领数据库市场的重要原因。

  如今,阿里云又定义了未来5年云内存数据库的发展思路!

1
相关文章