技术开发 频道

阿里云:云厂商入局数据库做了哪些思考?

  【IT168 评论】曾经,一提起数据库,似乎只有专业的数据库厂商才足以研发。现在,这个边界变得越来越模糊。在第九届中国数据库技术大会的现场,我们可以看到硬件厂商侃侃而谈自己的数据库产品,可以看到云计算厂商开始分享自己在数据库领域的研发成果。

  作为一家云计算厂商,数据库显然不是阿里云的主业,但在其官网的产品列表中,数据库产品在数量上具有绝对优势,为什么阿里云如此重视数据库的发展?商用产品和开源产品一大堆,阿里云做数据库的竞争力在哪?对于各大场合频频提起,多次被报道为数据库领域新趋势的HTAP,阿里云怎么看呢?

阿里云:云厂商入局数据库做了哪些思考?
▲阿里云数据库高级产品专家 萧少聪

  本文采访嘉宾:萧少聪(花名:铁庵)阿里云数据库高级产品专家。主要负责RDS产品的发展规划及产品演进。2011年获得Postgres Plus Professional认证,同年以理事身份筹建PostgreSQL中国用户会,2015-2018年担任PostgreSQL中国用户会主席。

阿里云:云厂商入局数据库做了哪些思考?
▲阿里云高级技术专家、架构师 曹龙

  曹龙(花名:封神),阿里云高级技术专家、架构师,专注在大数据分布式计算、数据库及存储领域,先后研发上万台Hadoop、ODPS集群,先后负责阿里YARN、Spark及自主研发内存计算引擎,目前为广大公有云用户提供专业的云HBase数据库及计算服务。

  踏足数据库领域,这家云计算厂商做了哪些思考?

  数据库是一款用户粘性非常高的产品,一旦核心业务数据落定,企业轻易不会尝试更换。在这个可以说对后来者不太友好的圈子,阿里云入局前是如何思考的呢?

  用户需求驱动和技术沉淀应该是大多数厂商踏足数据库领域的原因,这也同样是阿里云入局原因之一,只是在程度上有所不同。根据萧少聪的介绍,作为一家云计算厂商,阿里云长期服务于众多不同类型的用户,对用户痛点挖掘更深。在新的时代背景下,现有产品无法满足用户新的应用需求,同时不能充分发挥新硬件的性能;当然,这个问题不仅用户存在,阿里巴巴自身同样存在。阿里所面对的庞大数据量和复杂的业务场景是很多厂商无法触及的,这让阿里内部很早就着手于数据库的研发,目前提供的不少数据库产品正是阿里多年技术能力对外输出的表现。

  如果单凭这两点,阿里云确实有一定优势,但并不足以构成核心竞争力。对企业和厂商而言,现在做数据库的门槛并不像从前那么高,数据库领域的厂商也越来越多,核心竞争力只可能从差异性发展而来,人人都在做且会做的东西很难形成核心竞争力。

  曹龙表示,阿里云做数据库与第三方数据库厂商最大的差异性在于云,阿里云强调云数据库,这就意味着共享,通过程序共享,让企业享受更低成本,当然,前提是你的用户足够多;其次,阿里云平台的产品多样性以及无缝对接能力同样是很多厂商短时间内无法达到的,阿里云平台所承载的产品不仅仅只有云数据库,各产品之间已形成良好打通,一个平台足以解决多类场景问题。

  思考结束,阿里云正式踏入数据库领域,准确的说应该是踏入云数据库领域。

  开源商用,阿里云如何和开源产品拉开距离?

  阿里云不乏开源商用云数据库产品,萧少聪和曹龙本人负责的RDS系列及云HBase就是最好的示例。当然,不仅仅是阿里云,不少数据库厂商都会在开源基础上进行修改。既然是在开源基础上进行修改,企业不免思考这个事我自己能不能做?我是否有必要购买这款商用产品?

  企业要基于开源进行修改首要思考的就是技术和人才是否到位,人才问题暂且搁置一边,如果你有足够高的筹码,人才问题比较好解决。我们先来讨论技术问题,以阿里云RDS和云HBase为例,企业不妨看看阿里云都做了哪些改进?

  首先是云数据库RDS PPAS版,这是阿里云与EnterpriseDB公司合作基于PostgreSQL高度兼容Oracle语法的数据库服务。众所周知,EnterpriseDB本身就是一家提供基于PostgreSQL企业级产品与服务厂商,基于EnterpriseDB的部分技术能力,阿里云构建了自己的RDS PPAS版,萧少聪坦言,PPAS与PostgreSQL的内核都是一样的,PPAS只是多了Oracle兼容性,可唯这一点便解决了很多企业的大难题。

  企业中不乏想从Oracle迁移到其它商用或开源解决方案的,虽然迁移工具很多,但很难保证百分百兼容且应用程序完整迁移上云。PPAS要解决的问题是不同架构和不同底层数据库之间的迁移,将应用程序从Run Oracle完整迁移到Run PPAS。如果想更换其他开源解决方案,企业可以先从Oracle迁移到PPAS,整个过程语法改写较少。熟悉了云数据库架构之后,企业可以另行选择其他解决方案,PPAS在这个过程中更多扮演着桥梁的角色。 综上,这些都让PPAS与开源PostgreSQL、其他商用解决方案拉开距离。加之阿里云提供全流程的ADAM(亚当)平台,协助用户进行迁移的:事前评估、过程管理、数据同步、保障性回流、上线前性能对侧、应用程序兼容SQL发现等功能,使得用户进行数据库异构迁移过程更有保障。

  如果谈起曹龙负责的云数据库HBase,这是一款基于Hadoop且百分百兼容HBase协议的分布式数据库。近些年,HBase在许多大型甚至超大型公司被广泛应用,阿里巴巴内部就有很多场景应用了HBase,因此,性能优化从未停止。但是,追求性能的同时必然会损失其他特性,比如易用性、备份恢复等。阿里云对于HBase的改进首先从内核及架构开始,对读写、延迟以及压缩算法等各方面进行了深度优化;其次,完善中小企业关心的易用性、备份恢复以及SQL入口......

  RDS产品系列不只有PPAS,阿里云云数据库也不只有RDS和云HBase。萧少聪认为,今天所提到的数据库,不仅仅是一个引擎,更是一整套管理体系,一个完整的云解决方案,正是这样的定位让阿里云的云数据库产品与开源产品真正拉开距离,就好比虽在同一起点却是两条跑道。

  HTAP到底是不是数据库领域新趋势? 阿里云:是,但这不会是终局

  去年,我们就见过不少文章将HTAP列入未来数据库领域发展趋势之一,HTAP意味着可以通过一个数据库系统同时满足事务性需求和分析型需求,最具代表性的当属谷歌的Spanner+F1论文,产生了一大批NewSQL系统。对比这两年出现在数据库技术大会上的议题,今年关于HTAP的议题明显增多,这会是数据库领域的一大趋势吗?

  对此,曹龙表示HTAP很难称作数据库领域的趋势,如果算,可能也只是对少数公司而言。他表示,真正的大公司离线与在线分得很清楚,几乎不会做HTAP,因为数据量实在太大。其次,如果要做,数据往往要打通,这里所说的数据不仅仅是业务数据,而是整个集团的数据,这对于大公司而言很难实现,但如果某个业务团队有需求,还是可以实现的。

  萧少聪补充道,如果一家公司需要迅速将数据变现,在人力与物力不足的情况下,可以考虑采用HTAP的方式。同时,随着硬件成本的逐年降低,这种方式可以在公司短期的发展内满足诉求,但随着公司数据量的扩大,我们也依然很难通过一个数据库就解决所有问题。当数据量到达HTAP无法支撑时,通过独立并专业的OLTP、OLAP、BigData数据库系统,加上顺畅的数据通道,实现业务流通分层计算,依然是现今最为成熟的方案。

  综上,HTAP适用于部分体量的公司,可能是这类公司数量增多,也可能是业务部门对该技术的需求上升,导致了HTAP在数据库领域的关注度升高。但当公司成长到一定规模,这种方式显然不适用于业务发展,当前我们还没有看到HTAP可以做到独领风骚,但这一技术架构确实会是企业某一发展阶段的非常好的选择。

  结语

  近年来,从大批硬件和云计算厂商涌入数据库市场就可看出,数据库市场存在大量发展机会并蕴藏巨大价值。本以为阿里云做数据库不过是想分一杯羹,但细算下来,笔者发现这家云计算厂商对用户需求、企业痛点以及发展方向都做了不少思考,很擅长发挥自己的优势。当然,阿里云确实有先天优势,比如多年技术实力沉淀以及云计算业务积累的忠实用户。但是,数据库领域拼了这么久,谁又说得清胜负呢?路程还远,尚未到盖棺定论之时,但阿里云接下来在云数据库领域的一切行动还是值得期待的。

0
相关文章