【IT168 评论】从单一的DB2、Informix等数据库产品到“信息随需应变(IOD)”,从IOD再到管控整个数据生命周期的信息管理,从信息管理再到今天支撑“智慧地球”概念的新锐洞察,IBM的IM产品线战略到底在经历着怎样的发展和变化?IBM中国开发中心 信息管理产品开发部总经理吉燕勇先生近期做客中国最大的数据库技术社区ITPUB,为您解开IM产品线的战略发展脉络。

IBM中国开发中心 信息管理产品开发部总经理吉燕勇先生(左)
一 发展和变化:IM产品架构日趋完善
在企业信息化的进程中,很少有软件产品能像数据库系统这样充满着竞争和挑战,因为信息化的本质其实是围绕数据提供服务。
吉燕勇谈到,“说起IM大家很容易想起DB2,因为DB2已经是一个有二十年历史的产品了。实际上在过去几年到现在,我们的战略甚至品牌已经有了很大的变化。”
吉燕勇认为,从DM数据管理到IM信息管理,表面上是名称的变化,其实后面隐含的更多是战略变化。IBM在05年年初提出IOD就是信息随需应变战略,它的重点是说怎么能够从信息里面挖掘它的商业价值,能够让客户在今天的市场竞争里显出优势来。今年提出Information Management,含义是怎么能够利用信息主导你的变革,怎么能够在企业里面能够挖掘到商业价值,提供商业分析,商业优化,给客户带来更多的竞争优势。这是整个企业,整个品牌过去几年比较大的变化。
记者注意到,IBM为达成这个战略,在过去三五年里面花了将近一百亿美金以上,收购很多公司和产品来完善和充实IM产品线。比较大的收购都是发生在整个战略构想之下,包括Cognos、以及今年收购的SPSS、Exeros、Guardium等公司或产品。
如果将IBM的IM产品线简单梳理一下,发现最近几年通过自身的研发和大量收购,IBM的IM产品线架构已经日趋完整。从底层的数据库存储和管理,到中间层的数据集中与整合产品,再到最上层的商业智能工具,形成了一个解决企业多方面需求的完善的数据处理体系。
关于数据存储和管理产品,IBM数据库DB2自从推出9系列产品以来,它发布的频率比过去快很多了。包括9.5到现在不久前发布的9.7,每一个版本有很多新的特性,比如自动维护,存储压缩,刚刚发布的9.8包括数据性能等等。据了解,IBM计划在2010年第一季度发布DB2 9.8版。
根据吉燕勇总结介绍,从IBM DB29系列推出来以后,其实IBM围绕三个方面,第一块怎么能够给客户的投入降低下来。降低成本投入,这是我们的第一个重点;
第二个怎么能够提高数据库的可靠性。
第三是数据库的易用性,就是如何让用户用得更容易一些,所以一直围绕着成本、可靠性及使用方式来做发展。
“刚刚也谈到自动维护,自动维护是很好的例子,自动维护就是说怎么能够尽量减少DBA日常工作中的负担。我们根据客户的反馈,自动维护功能基本可以满足DBA(05:30)。有这个功能以后,DBA不需要时刻担心怎么改变参数,配置参数,它可以把很多时间花在业务上。并且因为它自动配置,所以可以避免因为调整参数,需要重起生产数据库,这是很好的例子。
第二块谈到存储压缩,我们提供包括表的压缩,包括索引压缩包括临时表压缩,包括大对象、xml压缩,这种压缩极大的减少了在存储方面的投入,并且能够更加提高性能。另外我们知道客户对xml这种数据形式很有兴趣,它有很多方便之处,所以我们也从9系列以后,一直推出很多对xml的支持,增加客户对DB2使用的方便性。”
对即将推出的DB2 9.8版本,吉燕勇谈到,IBM刚刚在2009年11月份推出了运行在IBM Power Systems
平台上的DB2 pureScale版本, 这一特性将会被用到DB2 9.8的通用版本中,这一特性将会极大地提高DB2产品的竞争力。
据介绍,DB2 pureScale主要围绕在三个方面,第一怎么能够提供无限的计算能力。随着数据的成长,企业的成长,数据成长以后怎么能够比较快的增加一些服务器,增强它的计算能力,仍然让业务比较顺畅运行下去,企业怎么能够比较快的扩展服务器,增强计算能力,提供对数据库的支持,这就是所说的“无限计算能力”;第二怎么能够提高它的持续可用,如果一个点出问题,比较快能够切换出来。第三,怎么利用透明化,就是希望数据对企业应用透明,客户修改了企业应用后,也能够很快使用起来。
“这个技术其实是基于主机数据库里的技术。用了十几年,然后我们把这个技术引进到开放平台里,这样能做到对数据不间断访问,对性能能做到线性扩展,这些是比较大的突破。用户有了这个技术以后,可以很容易在pureScale 里面加一个服务器,这样他只需要购买必须的设备,避免在硬件、软件上更大的投资” 吉燕勇说。
信息整合、主数据管理 & 数据仓库等产品,是位于中间的系列产品。
吉燕勇:“刚才谈到IOD,其实是三层架构,下面是管理数据,比如结构、非结构化数据,我们的DB2,我们的ECM,filenet,都属于下面的产品线;上面是做商业智能的,BI这个系统;中间层面是数据整合,怎么能够帮客户提供可信数据平台。这是一个丰富的产品线,包括怎么进行数据整合。因为刚才谈到结构化非结构化,很可能在企业里面也可能在企业外面,首先需要整合,整合可能数据是无序的,重复的,怎么能够进行一些清洗、能够怎么转化,变成比较好的、比较统一的数据,变成以后对里面很关键的数据,主数据怎么管起来,包括怎么建数据仓库,所以围绕这些方面有产品线,比如InfoSphere或Information Server专门在做数据整合,其实是想支撑你对企业内、企业外异构数据,无论结构化和非结构化,进行访问,进行整合工作,把企业数据有机整合过来,就是这个产品。我们InfoSphere QualityStage怎么能把一些杂乱的、重复的数据进行清洗,变成统一的、比较好的、有结构化的标准数据出来。我们的DataStage产品怎么能够通过从数据抽取进行数据转化,再把它放到目标数据仓库里, 就是我们所谓的ETL的过程。
我们也谈到主数据管理,主数据对企业很重要,它是企业在运营里面、在制定决策里,很重要的数据。在企业里面很多情况是说这个主数据往往在不同的部门,很可能是重复的,并且对企业没有统一的视图,我们想通过IBM主数据管理系统,把所有主数据放在主数据库里面,为整个企业提供统一的、标准的、比较全面的视图出来,帮决策者做工作决定。
IBM InfoSphere Warehouse,数据仓库也是业界比较全面的数据仓库解决方案,通过数据挖掘,通过建模,通过积分,通过数据分析,为我们以后创建比较好的分析的一种动态报表,打下很好的基础。通过它可以解决数据的整合,可以把所有不相关的数据或者重复数据进行清洗和转化,给客户真实的、统一的、可信的视图出来。”
IM产品线的架构已经非常全面,底下有数据库,对结构化非结构化数据我们都进行统一管理,中间有数据的InfoSphere这个产品,上面还有Cognos和spss等产品。Cognos可能更多是展现方面,SPSS更多的是数据的一些分析、预测。通过自身研发和不断收购整合,IBM终于完成了整个IM产品线的产品架构布局。