技术开发 频道

SybaseIQ12.7用户可免费升级至15

  【IT168 专稿】和很多CTO不一样,赛贝斯软件(中国)有限公司CTO卢东明是一个风趣善谈的人并不刻板。用专业来形容他,丝毫不为过。“专业”的含义不仅包含他对技术的理解,在面对采访时的语言组织、用词的严谨及幽默程度都堪称完美。


赛贝斯软件(中国)有限公司CTO卢东明

  在信息爆炸的时代,IT的价值就在于对数据库的收集、处理和预测分析。数据越来越多,海量的数据库每天都在积累,如果不能从中获得分析和有价值的结论,这些数据就会变得毫无意义,成为垃圾,这将成为企业迫切需要解决的问题。Sybase IQ15就是为智能分析而生,高压缩、高速查询、高速加载,让Sybase IQ15有着别样的魅力。

  在与卢东明的对话中,可以强烈感受到他对Sybase IQ的自信。Sybase IQ虽然在数据仓库取得了不菲的业绩,但是在卢东明看来Sybase IQ仍然看到很多后续发展的方向和空间。Sybase IQ 15在今年3月份已经正式推出,据了解Sybase IQ 12.7的合法用户升到Sybase IQ 15是免费的。

  IT168:Sybase IQ15从技术上讲有那些创新?与之前的Sybase IQ12.7相比有着怎样的改变?

  卢东明:你知道空客前段时间推出了A380吗?A380给人们带来很多好处,它推出新款是一个运输能力和能源使用率的全面提升,不单单是飞机大了,装的人和货多了,它的出现对空中运输业的很多方面提出了改进,比如机场可能要专门设计双层的廊桥来进一步提高登机的效率。Sybase IQ 15也是这样,一个大版本的推出对用户及合作伙伴有着深远的影响。

  (加载的提高)

  我们在原有体系架构里,是一个写节点和多个读节点的配置。现在随着很多企业数据量的增加,其实对企业的需求也成倍提高。所以Sybase IQ15版提出多个写节点和多个读节点的新体系配置。也就是说我们每个节点都可充当写的任务,也可以充当读的任务。这样就使得用户加载得到了更充分使用硬件的资源,效率也就提高了。这是加载的提高,客户端加载对应用来说很有用,原来对IQ这样的服务器来说,我们说想加载必须传到服务器端加载,这样就存在效率和安全性问题,因为有些数据不希望你看到原文件,而是完全从应用角度来加载。我们在IQ15版里提供了一个客户端数据加载,通过客户端一个命令就可以加载,简化应用逻辑。

  (查询的提高)

  我们现在采取了一种智能并行查询机制。举一个简单的例子,就好象有一条高速公路,上面可能有四条或八条车道,就相当于我们有四个/八个CPU的机制,过去我们对高速公路的认识是这上面可能有几百辆车在跑,所以规定每辆车只用一个通道,大家遵守交通规则,大家不要乱窜道,要互相配合。但如果夜里两点多钟路上没什么车,但现在我有一个特别大量的货车要尽快通过关卡,如果只给你一条车道,一是其他车道没有得到利用,二是速度自然就拖慢了。现在IQ提供一个智能的查询机制,如果没有人进来的时候,可以把4个CPU的资源全占,如果有人进来的时候,可以让你让出一条,再有人进来再多让出一条,可以保证公路和CPU资源不至于为某一个任务或者某一辆车过多地分配资源。所以这是一个在以前的体系里很少做到的,IQ15把这个功能做出来以后,让我们看到两类应用,单一任务可以得到很大的提高,单一的小任务也可以提高,这两类应用都可以做到。IQ15对多核进行了充分的认可,在技术上可以充分利用多核技术,在商务层面上对多核还有一个特殊的支撑。

  (压缩的提高)

  我们最新推出了FP3,就是三位的FP索引,把唯一值空间推到了1600万。这是一个什么概念呢?比中国移动稍微小一点的大型企业,客户可能有几百万人,都可以通过三位FP压缩形式来存储。这是IQ15版一个新的突破,在这样的突破下,过去一个200多M数据文件,在IQ12.7里可以压缩到152M,但是在IQ15里进一步压缩到了50多M,这就是四、五倍的压缩比。

  IT168:Sybase IQ12.7升级到Sybase IQ15是免费还是收费的?我想用户更关心Sybase IQ15是否稳定可靠?

  卢东明: Sybase IQ 12.7的合法用户升到Sybase IQ 15是免费的。关于稳定性,可靠性的问题,我们也非常重视,我们在推广Sybase IQ 15之前投入了很大力量。从去年12月1日开始,Sybase在全球做了非常详细的数据测试计划,这个计划一共持续了半年时间,这是跟全球用户来做的。全球六个国家参加这么大的数据测试计划,我们Sybase中国也选择了最高端的客户正式参与进来。花了六个月的时间,详细验证这个产品的优缺点,到今年3月份正式推出时,我们心里其实已经很有底了。SybaseIQ 15相当稳定,而且所有宣称的功能都覆盖了。

  IT168: 刚才我们谈过了Sybase IQ15在加载,压缩,查询方面的一些创新,我们知道列式数据库相比行式数据库的优势是在分析上,Sybase IQ15在数据分析上是否有所增强?

  卢东明:分析和BI功能是兵家必争之地。现在很多企业面临的是分析能力方面的需求。当数据量达到一定程度后,其分析能力对企业挖掘核心价值来说是最重要的,他们在这方面的能力一直受到严峻挑战。现在有一个能力和需求的缺口,大家对数据分析这方面的需求几乎是很高的上涨曲线,目前在行式数据库基础上能够实现的功能是有限的,而且没有突破。没有突破就不会出现陡然上升的趋势。但是Sybase IQ列式数据库技术越来越成熟,包括Sybase IQ15版使得我们在分析技术上有提高,我们是唯一可以把空白填补的公司。

  Sybase IQ15出来后不到三个月时间我们又推出了Sybase IQ 15.1,这两个版本几乎是同时出来的。IQ15.1也推出了一个非常先进的东西,叫In- database Analytics(数据库内分析),IQ是针对分析做的,有压缩、高速查询、高速加载,如果真开发应用有相当多的应用类型是把IQ数据通过简单筛选,筛到客户端做复杂的数据运算,比如标准方差、协方差、相关度、趋势或者股票走势图这样的东西。这就存在一个工作量,可能需要在几百亿行里筛选出一两万行或者几十万行,然后做一个数据模型,这个工作由IQ完成了,最后作标准方差、协方差、相关度这样的工作,还是需要一些工具。现在IQ15.1把这部分工作拿到服务器上做,我们接了一个国际专门做数据库的公司,把它的库接到IQ里,可以充分享用并行计算的机制。可以在压缩的情况下,并行着用非常先进的数据库来算这个东西。大家知道Sybase是很注重平台的公司,我们做的开发工具也好、数据也好,都是基于平台的。Sybase做了IQ15.1以后,使IQ这个平台软件离应用软件更近了。以前知道IQ的人多半都是DBA或者一个公司的架构师。但是到了开发人员,往往是架构师下命令我们已经买了IQ,你们得学、得用。现在如果你是一个开发人员发现有一个数据库可以做In- database Analytics,我就不用自己编程了。我们现在也在开发层面做一些功能,便于更贴近开发人员。

  IT168:听说这次Sybase给中国用户带来一个新的技术CEP,什么是CEP?

  卢东明:CEP是Complex Event Processing(复杂事件处理)的缩写。这种软件或者这一类软件,现在有一个很强的势头,拿它跟以前的应用做一个比较。我们把所有事按两个轴来分,一个轴是处理速度,一个轴是事件复杂度。OLTP处理的事情是低速、低复杂度。这个事情可能是A给B打一个电话,几点几分接通,打了多长时间,计费计多少钱。BI相对来说事情就复杂得多,不仅仅要记下来,而是在上亿条记录中分析到底我们整个通话记录中,到底有多少是跨外网的通话,多少是网内的电话。对BI来说是低速高复杂度。还有一类应用是消息队列,消息队列是高速的,什么事情发生了要快速处理,股票成交了就有一个消息出来,但消息队列里复杂度是很低的,只有一个信息量,但不处理。还有一部分既高速又要复杂处理,这类软件就叫CEP。Sybase CEP使用CCL(Continuous Computation Language,持续计算语言)高效地使用描述的方式来开发CEP应用,大大提高了CEP应用的开发效率和运行效率。和Sybase其他数据平台的技术(像Sybase IQ,Sybase RAP)结合,能够帮助企业实现真正的企业级,实时事件处理。

  IT168:Sybase IQ在数据仓库领域是领先的,那么如何保持进一步的领先优势?Sybase IQ15跟Sybase IQ12.7比,可以提高一倍的压缩,IBM的DB2 V9的压缩也不错,可以压缩至五分之一。

  卢东明:Sybase不是一个很大的公司,跟大牌公司竞争没有点绝招真的不可能生存到今天。现在Sybase和许多数据库厂商思路不太一样,这也与我们公司所处的竞争环境有关。在数据库厂商中,Sybase是公认的第四大,但前三大在市值上至少比我们大几十倍。这就像一个小孩儿和怪兽打架的时,暂且不要论输赢,关键是生存下来。我们不会和这些厂商在环法冲刺赛段比0.01秒的差距。在环法山路赛段,在大家不太擅长的领域里,Sybase却有很多优势,我们是希望在这些赛段里能够创出非常好的成绩来,才能把Sybase做大。

  Sybase IQ以前在BI(商务智能)领域就是领先的,现在我们进一步扩大领先的优势。首先我们有专利技术的优势,这些东西不是任何公司都容易追赶的。这也是为什么目前市场上只有Sybase一家在市场上做列式数据库。美国市场上真正做商用的列式数据库,Sybase是最大的。

  我这么多年的经验,我觉得Sybase和这些大公司竞争,最重要的优势就是很多东西要拿到实际场景里做的。比如你刚刚讲的压缩功能。我们的压缩功能非常简单。DB2的压缩我也了解一些,他们的确在某种场景下可以压缩很高,甚至比五分之一还高。但在实际的应用场景下,它的压缩方式往往会导致唯一值上得很高,在一个大型数据仓库里会遇到很强的挑战。

0
相关文章