技术开发 频道

SybaseIQ12.7用户可免费升级至15

  IT168: 刚才我们谈过了Sybase IQ15在加载,压缩,查询方面的一些创新,我们知道列式数据库相比行式数据库的优势是在分析上,Sybase IQ15在数据分析上是否有所增强?

  卢东明:分析和BI功能是兵家必争之地。现在很多企业面临的是分析能力方面的需求。当数据量达到一定程度后,其分析能力对企业挖掘核心价值来说是最重要的,他们在这方面的能力一直受到严峻挑战。现在有一个能力和需求的缺口,大家对数据分析这方面的需求几乎是很高的上涨曲线,目前在行式数据库基础上能够实现的功能是有限的,而且没有突破。没有突破就不会出现陡然上升的趋势。但是Sybase IQ列式数据库技术越来越成熟,包括Sybase IQ15版使得我们在分析技术上有提高,我们是唯一可以把空白填补的公司。

  Sybase IQ15出来后不到三个月时间我们又推出了Sybase IQ 15.1,这两个版本几乎是同时出来的。IQ15.1也推出了一个非常先进的东西,叫In- database Analytics(数据库内分析),IQ是针对分析做的,有压缩、高速查询、高速加载,如果真开发应用有相当多的应用类型是把IQ数据通过简单筛选,筛到客户端做复杂的数据运算,比如标准方差、协方差、相关度、趋势或者股票走势图这样的东西。这就存在一个工作量,可能需要在几百亿行里筛选出一两万行或者几十万行,然后做一个数据模型,这个工作由IQ完成了,最后作标准方差、协方差、相关度这样的工作,还是需要一些工具。现在IQ15.1把这部分工作拿到服务器上做,我们接了一个国际专门做数据库的公司,把它的库接到IQ里,可以充分享用并行计算的机制。可以在压缩的情况下,并行着用非常先进的数据库来算这个东西。大家知道Sybase是很注重平台的公司,我们做的开发工具也好、数据也好,都是基于平台的。Sybase做了IQ15.1以后,使IQ这个平台软件离应用软件更近了。以前知道IQ的人多半都是DBA或者一个公司的架构师。但是到了开发人员,往往是架构师下命令我们已经买了IQ,你们得学、得用。现在如果你是一个开发人员发现有一个数据库可以做In- database Analytics,我就不用自己编程了。我们现在也在开发层面做一些功能,便于更贴近开发人员。

  IT168:听说这次Sybase给中国用户带来一个新的技术CEP,什么是CEP?

  卢东明:CEP是Complex Event Processing(复杂事件处理)的缩写。这种软件或者这一类软件,现在有一个很强的势头,拿它跟以前的应用做一个比较。我们把所有事按两个轴来分,一个轴是处理速度,一个轴是事件复杂度。OLTP处理的事情是低速、低复杂度。这个事情可能是A给B打一个电话,几点几分接通,打了多长时间,计费计多少钱。BI相对来说事情就复杂得多,不仅仅要记下来,而是在上亿条记录中分析到底我们整个通话记录中,到底有多少是跨外网的通话,多少是网内的电话。对BI来说是低速高复杂度。还有一类应用是消息队列,消息队列是高速的,什么事情发生了要快速处理,股票成交了就有一个消息出来,但消息队列里复杂度是很低的,只有一个信息量,但不处理。还有一部分既高速又要复杂处理,这类软件就叫CEP。Sybase CEP使用CCL(Continuous Computation Language,持续计算语言)高效地使用描述的方式来开发CEP应用,大大提高了CEP应用的开发效率和运行效率。和Sybase其他数据平台的技术(像Sybase IQ,Sybase RAP)结合,能够帮助企业实现真正的企业级,实时事件处理。

  IT168:Sybase IQ在数据仓库领域是领先的,那么如何保持进一步的领先优势?Sybase IQ15跟Sybase IQ12.7比,可以提高一倍的压缩,IBM的DB2 V9的压缩也不错,可以压缩至五分之一。

  卢东明:Sybase不是一个很大的公司,跟大牌公司竞争没有点绝招真的不可能生存到今天。现在Sybase和许多数据库厂商思路不太一样,这也与我们公司所处的竞争环境有关。在数据库厂商中,Sybase是公认的第四大,但前三大在市值上至少比我们大几十倍。这就像一个小孩儿和怪兽打架的时,暂且不要论输赢,关键是生存下来。我们不会和这些厂商在环法冲刺赛段比0.01秒的差距。在环法山路赛段,在大家不太擅长的领域里,Sybase却有很多优势,我们是希望在这些赛段里能够创出非常好的成绩来,才能把Sybase做大。

  Sybase IQ以前在BI(商务智能)领域就是领先的,现在我们进一步扩大领先的优势。首先我们有专利技术的优势,这些东西不是任何公司都容易追赶的。这也是为什么目前市场上只有Sybase一家在市场上做列式数据库。美国市场上真正做商用的列式数据库,Sybase是最大的。

  我这么多年的经验,我觉得Sybase和这些大公司竞争,最重要的优势就是很多东西要拿到实际场景里做的。比如你刚刚讲的压缩功能。我们的压缩功能非常简单。DB2的压缩我也了解一些,他们的确在某种场景下可以压缩很高,甚至比五分之一还高。但在实际的应用场景下,它的压缩方式往往会导致唯一值上得很高,在一个大型数据仓库里会遇到很强的挑战。

0
相关文章