新需求催生MDM
这种解决办法不同于传统的数据集成。ZapThink的Schmelzer回忆说:“我们过去一直通过在关键堵点上实施控制来解决数据集成问题。而SOA消除了这些堵点。这意味着每个数据访问点都必须能转换和管理数据。”
IDC集成系统集团的副总裁Henry Morris说:“数据集成和流程集成是紧密连接的。”他建议企业必须考虑利用服务来管理数据,以及影响主数据的流程。
Kanbay国际咨询公司主设计师Nikhil Shah指出,SOA还提出了并行性问题。例如,当旧数据通过流程传播,或者当多个服务在不同时间访问数据时,流程过程中数据的变化就会影响到结果,尤其是在复合型应用中。Shah建议,IT要部署监测服务,至少部署在发生变更时通知其他服务的服务,以使它们可以决定是重新启动流程,还是调整对它们的计算。
此外,Shah说,数据服务的颗粒度越细,编排(orchestration)的开销对流程的影响就越大,因为它会增加响应时间,导致同步问题。他建议IT在服务能够消费数据前,就建立数据管理需求模型。
为SOA环境中的数据管理提供缓存技术的Progress 软件公司数据管理副总裁Ken Rugg说,另一个问题是SOA的“雪犁效应”,这种效应发生在服务把有关数据处理的上下文关系传递给复合应用中后续服务的时候。
IDC的Morris说,公布这些转换可以帮助以后的服务了解它们正在使用数据的上下文关系。不过,这也可能使系统被非常庞大的数据文件所淹没,降低每个服务的速度。
SOA的兴起使厂商有理由重新利用他们的工具为SOA和非SOA环境简化数据管理。很多厂商正在推广MDM(主数据管理)工具,来确保应用或服务在正确的上下文关系中使用正确的、当前的数据。“主数据”不仅包含数据本身,而且还包含了供不同系统使用所需要的属性、语义及上下文关系(即元数据)。一些厂商把这类系统称为企业信息集成(EII)工具。
下一步是数据集线器
AMR Research公司研究主管BIll Swanton指出,MDM虽然不是新概念,但它基本上属于事后数据系统,例如数据仓库和业务智能。在SOA出现前,企业基本不用担心主数据问题,因为大多数信息保存在应用套件中,而在应用套件中,厂商至少部署了隐含的、内部的数据架构。所以,IT可以只关注在应用套件之间传送的或原始的数据,通过连接器的建立使应用能够处理大多数的上下文关系。
SOA的多对多架构让IT不能继续把这个问题留给应用厂商和集成渠道。不过Swanton说,现在连非SOA环境也将放弃开发连接器的方法,转而向更易于集成的数据架构迁移。
IBM、Informatica、Oracle和Siperian等公司开始从数据仓库着手解决这一问题,它们提供一个或更多的数据集线器当作可信赖代理,服务从净化的数据存储或由其他应用生成有效数据的服务访问数据集线器。数据集线器类似于传统企业环境中常用的中心辐射架构。
专家警告说,目前这些技术还很不成熟,最多只能对特定的数据管理流程起作用。
很多数据集线器含有一个适用的数据主题,比如客户或产品信息。i2公司MDM业务高级经理Satish Krishnaswamy说,MDM作为一个初始构件还是不错的;但在以后,IT必须普及数据集线器或使用特定的数据集线器联盟。IDC的Morris说,“我们不会总局限在一个数据集线器上,因此IT应当向一个标准、规范、分级、跨不同来源的数据视图的方向努力。”
为使这个系统易于管理,IT部门通常为一个主题领域定义规则和上下文关系,然后逐步扩展到其他领域。决定是从一个特定主题系统,例如SCM中的产品信息入手,还是从一个一般化的系统入手,这取决于对具体应用套件集成工作的关注力度。如果你的关注焦点放在与ERP或SCM的互动上,那么从特定主题的数据中心入手可能是更为合理的选择。反之,假如你的焦点放在服务与不同应用互动的SOA上,那么从一个一般的数据中心入手则更合理。