技术开发 频道

解读Informatica数据集成治理创新方案

【IT168 评论】Informatica是知名的企业数据解决方案提供商。在全球范围内,超过5,500 家企业在使用其产品与服务。今年5月11-15日在美国拉斯维加斯举办的第16届Informatica全球用户大会上,发布了五大解决方案。

  近日,Informatica召开了小型媒体沟通会,针对国内企业数据集成处理的现状、发展情况,以及其产品对此情况的应对等问题展开了讨论。Informatica创新的五大解决方案在合作伙伴间初步实施,为数据集成领域产品革新迈进了一大步。

  相关名词解读

  1.主数据

  主数据指系统间共享数据(例如,客户、供应商、账户和组织部门相关数据),是各类业务都需要的基准数据。与记录业务活动,波动较大的交易数据相比,主数据变化缓慢。但主数据必须存在并加以正确维护,才能保证交易系统的参照完整性。

  2.数据集成

  在企业中,往往有多个异构的、运行在不同平台上的信息系统同时运行,这些系统的数据源彼此独立、相互封闭,规则不统一,数据难以在系统之间交流、共享和融合,从而形成了"信息孤岛"。这使企业内部、企业与外部信息交互十分艰难。数据集成统一规则,通过应用间的数据交换从而达到集成,主要解决数据的分布性和异构性的问题。数据集成可为企业提供全面的数据共享。

  3.数据清洗

  数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理残缺、无效、错误、重复等数据。

  4.数据脱敏

  指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。

  Informatica创新五大解决方案原因

  大数据迅猛发展背景下,国内企业对于数据处理的需求日益增加。很多企业已经觉察到了数据处理分析所能带来的利益。但苦于没有相应的技术和人员,且大多数数据集成厂商提供的产品门太粗放,技术门槛太高,有时候买了软件却不会使用,最后还是用最传统的办法解决了事,效果不好也没办法。目前国内企业对数据集成方面产品的需求很大,但真正符合企业需求,易用且个性化的产品很少。

  1.企业级产品很难解决企业级甚至部门级需求差异

  公司的业务部门(例如财务部)常有需要获取公司各业务的数据来做报表,但从各种系统中导出的数据规则不一样,使用它们处理出的结果也都不一样的,那么该以哪个数据为标准来做这份报表?各业务部门的人大多没有经过系统的技术培训,对于复杂庞大的数据他们很难看懂并利用。在这种情况下,一则技术人员或数据集成商集成数据提供给他们,但往往沟通不畅,结果混乱;二则采用最传统的办法,人工复制数据到excel里处理。

  2.部门间数据交流没有打通

  企业各个业务以及部门间应有的数据交流并没有打通,许多应共享的数据更新不及时,造成业务流程上的断裂。这些都对公司的发展产生了很大影响。

  3.不具备数据脱敏能力

  很多企业在数据传输过程中都没有数据脱敏处理,将所有传输的信息没有选择的打包发出,一些敏感信息(例如客户身份证号,只需要发送后四位即可)也全部发送,致使用户敏感信息的泄露。这会导致错失很多商机,或是内部信息资源被盗用,数据安全无保障。

  4.不具备数据清洗能力

  企业产生的很多数据都是杂乱的信息,没有经过整理,包含很多无用信息,而这些信息并不能被企业利用,产生数据价值。很多企业没有数据清洗的能力,或是因清洗数据花费太大而放弃。企业的洞察力没办法加强,竞争力越来越弱。

  Informatica五大解决方案 思路的变革

  Informatica新推出的五大解决方案是对于数据集成产品使用思路上的变革,变革的目的在贴近业务需求,提升易用性,并且可以让用户随需购买。它们其实相当于对于以往产品的拓展和封装,以前的产品对于业务人员来说过于专业,业务人员可能不理解这些软件真正的作用,或是不直接使用软件,且软件导出各个业务的数据不合规,参考起来很不方便。

  此次Informatica将这些应用封装成解决方案,提升了易用性和可视性,用户可以“看到”我究竟买的是什么服务。并且业务人员能够直接单独操作应用,即需要什么形式的数据,可自主选择导出什么形式的数据。

  目前Informatica的数据集成产品分不同层级,PaaS级的平台服务、SaaS级的软件服务以及新推出的全面解决方案,并且其中的单个产品允许单独随需购买。这为一些资金不是很富裕的中小型用户提供了便利。

  解决方案的自助化服务模式意在让更多的人能够参与到数据处理中,Informatica提供的是新的使用思路。新方案将数据集成应用向业务人员推进了一步,使得业务部门人员的参与度更高,需求与产品的对应更加契合,目的就是为了适应需求的差异性。

  Informatica首席技术顾问在会上表示:“现在客户多数侧重自助服务平台,我们也在做准备,怎么能让更多的大型中型企业,甚至小型企业都能开始大数据,开始数据治理,以前产品太贵,他们根本买不起。”

  解读五大解决方案

  1.数据洞察

  数据洞察现在已经慢慢面向分析领域,而不仅是单纯的给数据仓库处理数据。Informatica最新发布的数据洞察解决方案可以帮助企业进行前期数据的预处理,并且将可处理的来源变得越来越多,集成企业内和企业间杂乱的数据,发现数据间的规律,获得有价值的可比较和参考的数据。此方案还可实现各类数据源链接问题。此方案同样适于个性化需求高的用户及部门级用户。并且,其所出的结果不局限于一份报表,而是业务人员可直接使用的数据。

  2.全面客户关系管理

  全面客户关系管理(TCRM)是由基于主数据方向上的应用,在大数据上的集成。主要指,客户、客户数据以及客户关系的一些整理和管理。传统客户关系管理,管理订单比客户还多,搜索一个用户名,出来的数据十分繁杂,无法判断所需要的有用信息。此方案从企业的视图出发,当有多套CRM系统时同样可以实现数据集成,连接各系统的数据源,筛选修正错误数据,统一客户数据。

  3.数据云

  Informatica数据云主要解决组织的云和云之间、云端到落地之间的连接问题。Informatica公司积累的大量数据,其数据本身也作为云服务提供给用户。

  4.应用整合

  应用整合打通各种系统及数据间的关系,包括数据仓库、客户整合等,它是一种横向的整合,实现上下游企业之间,以及企业内外之间的数据交换,同时还提供从项目实施到淘汰的生命周期管理以及数据安全管理。生命周期管理可以使用户提前预估项目各个时期的数据,给企业作为参考。数据安全管理最重要的功能就是对数据的脱敏处理。

  5.数据治理分析

  数据治理是对元数据的规则定义、对数据质量的衡量以及数据仓库等等,它可以统一标准化数据,分析提取高质量数据,形成数据资产,帮助企业创造利益。Informatica以其产品支撑,将产品封装成应用,其数据治理方案侧重于分析企业数据现状,制定目标,定义相关规则,带来有参考价值的数据。企业可凭借这些数据进行项目的评估、用户行为的预测等等。

1
相关文章