技术开发 频道

破旧立新,6个问答看偶数科技在短短一年中的新变化?

  【IT168 评论】2018年10月17日,偶数科技创始人常雷作为第十届中国系统架构师大会的特邀演讲嘉宾在会上进行了《新一代数据仓库OushuDB演进之路》的主题演讲,这是笔者第二次接触采访常雷,距离上次采访已有一年之久了。

  2017年10月到2018年10月,这一年时间对于偶数科技来说是一个很重要的时间节点,这一年中,偶数科技完成了红杉中国领投、红点中国跟投的A轮融资;核心产品OushuDB完成了多次产品迭代;入选微软加速器并圆满毕业;主导的HAWQ项目成功晋升为Apache 优异项目……

  从上文中不难看出,这一年偶数科技不仅在积极破旧,同时也在立新,那么对于这一年中的变化,常雷作为企业发展的领导者又是如何解读的呢?下面我们就从公司定位、产品发展、竞争合作等多个维度来解读一下。

  嘉宾介绍:

  常雷,偶数科技创始人兼CEO,2008年毕业于北京大学计算机系。常雷是 Apache HAWQ创始人,曾任EMC高级研究员、EMC/ Pivotal研发部总监,长期专注于人工智能、大数据与云计算领域,在国内外优异数据管理期刊和会议(如 SIGMOD等)发表数篇论文,并拥有多项国际专利。

  采访实录:

  1.偶数的定位是“一家领先的AI和大数据软件提供商”,请问偶数科技内部是如何定位人工智能?

  常雷:偶数最开始是做数据分析的工作,而数据和人工智能是密不可分的。之前,我们并没有把机器学习独立出来,而是在OushuDB有一个机器学习的库MADlib。后来,我们在人工智能方面做了大量的工作,例如自动化机器学习等等,我们认为时机成熟了,是时候将人工智能独立出来做一个单独的产品线了。

  所以,对用户来说,人工智能是新出现的一条产品线,但是对偶数内部来说是一直存在的。

  2.能否介绍一下“人工智能”这条新产品线?

  常雷:在产品方面我们是遵循一条主线——数据分析和人工智能,围绕这条主线,产品线的形态会发生一些变化。之前,我们的OushuDB以及内置的人工智能库都是在私有云上跑,而现在我们和微软合作将它们放到了公有云平台上,形成了一个新的产品——Lava。Lava实际上是一个将OushuDB或LittleBoy放到公有云上的系统,提供的服务仍然是数据仓库服务和人工智能服务。

  刚才也提到人工智能并不是全新的产品线,现在独立出来,对用户最大的好处是开发应用时能够清晰明确在何种场景下该使用何种产品。

  3.除了人工智能产品线,大家也很关心偶数的核心产品OushuDB在这一年的发展变化。

  常雷:2017年9月,偶数正式发布了Oushu Database 3.0。OushuDB 3.0其实是我们性能优化的第一个版本,当时它只可以支持一些简单的查询,在TPCH(国际上公认的SQL性能测试标准)的20多个查询中只支持Q1和Q6,而且在语法上也有诸多限制。

  这一年中,我们进行了从3.0到3.X再到4.0的版本研发,并支持了TPCH所有的22个查询。而这一变化对于产品功能和用户体验来说都是一个巨大的提升,因为真实客户环境中的工作负载是非常复杂的,它需要支持各种各样的语法。另外,在性能方面也有了很大的提升,与我们自己之前的版本相比,大约是5到10倍的性能提升,而与传统的SQL引擎来,可以快到几十倍。

  4.您刚才在演讲中提到OushuDB 4.0也将很快和大家见面,能否提前剧透一下OushuDB 4.0的亮点?

  常雷:OushuDB 4.0最大的亮点有两个,第一个是新的SIMD执行器成熟了,之前可能只有少部分场景可以用得上新执行器,功能也不是很齐全;第二个是我们添加了update、delete等传统数据库支持的经典功能。这是SQL on Hadoop引擎一直解决不好的部分,它们做update、delete、index等操作是非常慢的,基本上不可用。OushuDB 4.0解决了这一问题对用户来说意味着什么呢?就是你在享受十倍性能提升的同时,还可以像使用Oracle那样使用OushuDB。

  5.上文我们提到了偶数去年加入了微软加速器,能否透露一下双方具体的合作事宜?偶数是如何选择云平台合作伙伴的?

  常雷:加入微软加速器对于我们的帮助其实不小,尤其是在产品和市场方面的帮助。在云上,我们双方的合作可以分为两部分,一部分是把我们的产品直接发布在Azure上形成新的服务;另一部分是我们将OushuDB及其它一些组件放到了微软的云市场上。

  企业要在云平台上开发一些底层系统,如果不和云厂商合作的话,相对来说会有一些局限。我们双方的合作模式是微软提供底层强大的IaaS平台支持,而我们提供数据分析和人工智能产品。

  在云平台的合作方面其实我们是很开放的,因为我们的产品是独立的组件。之所以优先选择微软,一是因为微软Azure的知名度,二是因为微软Azure在全球公有云市场的份额也很靠前。之后,我们也会在其它云上发布我们的产品,大家可以期待一下。

  6.有合作肯定就也有竞争,现在进入数据库领域的厂商越来越多,BAT、初创公司、跨界公司等等,您如何看待偶数和他们之间的关系?

  常雷:很多厂商入局数据库,证明这个行业有需求,而且只有大家一起做整个行业才能变好。关于竞争关系,我们认为至少现在还不存在。

  首先,BAT等企业其实更专注于解决自家的业务需求,其使用了大量的开源软件,甚至也会有我们的产品HAWQ。而偶数走的是另一个更加创新的模式,我们的产品能够快速响应客户需求,并快速迭代。另外,偶数是提供产品,BAT都有自己的云平台,我们之间其实是互补的,更可能形成一种合作关系。

  目前,做新一代云数据仓库的公司其实很少,我们算一家,大部分还是基于传统数据仓库,所以市场广阔基本竞争还不是很大。云数据仓库是大趋势,传统厂商是必然要跟随的,但是当传统厂商的产品经过数十年的发展,很难对其产品进行很大的改动,所以,在技术的沉淀和积累期,偶数其实一直是“引领”的状态。

  写在最后:

  其实,我一直在思考用一个什么样的词来形容偶数科技这一年的变化,后来我想到了一个贴切的词——“新瓶陈酿”。这里的“新瓶”指的是偶数科技全新的“人工智能”产品线以及产品形态,而“陈酿”指的是偶数科技不断创新加深的技术迭代。也许,未来你会看到偶数会有更多的产品形态,甚至是新的产品线,但其内在始终不变的是技术创新,随着时间的沉淀,这“陈酿”定会越来越诱人!

0
相关文章