技术开发 频道

EMC蔡汉辉:打造大数据时代的"Facebook"

  【IT168 专稿】数据大爆炸的时代已经来临,Oracle、IBM、HP、微软等IT巨头都将目光聚焦到了大数据,专事数据存储的EMC不可能没有大动作。

  2010年,EMC斥资收购了Isilon和Greenplum,前者以横向扩展架构解决大数据存储与访问问题,后者则侧重数据挖掘与分析,且在业内首次实现结构化数据与非结构化数据的统一管理。此外,EMC还对其原有的Atmos产品线进行进一步完善,并收购了敏捷软件开发服务和工具提供商Privotal Labs,如今EMC在大数据领域已经完成初步的战略布局。

  近日,EMC正式发布一款针对大数据社交与协作分析的数据挖掘平台:Greenplum Chorus,并进一步完善其大数据构想。

  大数据之旅的三个阶段

  “EMC的大数据市场策略分三个阶段。”EMC全球副总裁兼中国区总裁蔡汉辉介绍:“第一个阶段是构建一个云基础架构,通过灵活的横向扩展架构存储系统,解决大数据对传统存储带来的挑战;第二个阶段被称之为社交化阶段,提供一个自助的可交互的数据分析平台,强调数据分析过程中的协作;第三阶段则需要以敏捷的服务应对一些定制化数据分析需求。”

大数据之旅的三个阶段
▲EMC全球副总裁兼中国区总裁蔡汉辉

  “为什么先有云是第一步呢?” 蔡汉辉解释:首先大数据的特点之一就是“海量”,这些数据包括了传统的结构化数据和非结构化数据,如果要走完大数据之旅,首先必须提供一个基础的存储平台,有效地应对大数据存储问题,这个基础的平台其实就是云。”

大数据之旅的三个阶段
▲EMC规划的大数据之旅三个阶段:第一阶段强调构建适用云和大数据环境的数据存储平台、第二阶段强调大数据的社交与交互,第三阶段强调针对定制化需求的敏捷性

  蔡汉辉介绍,EMC针对大数据应用的三个不同层次都提供了相应的解决方案。例如第一阶段,EMC提供了Isilon、Atmos两个系列的横向扩展存储系统,分别针对不同细分市场,且各自在业内拥有强劲竞争力,成为支撑云计算和大数据应用的有效的存储平台;第二阶段则涉及到EMC本次发布的重点Greenplum Chorus;而第三阶段则有EMC不久前收购的敏捷开发领域领导厂商Pivotal Labs融入EMC大数据整体战略。

${PageNumber}

  大数据时代的”Facebook”

  “先有云”,是蔡汉辉介绍的大数据之旅的第一步,跨过了第一步,则需要考虑数据分析中的协同与交互问题,Greenplum Chorus是EMC在大数据之旅的第二阶段重点打造的产品平台,致力于构建大数据时代的”Facebook”。

大数据时代的”Facebook”
▲EMC中国卓越研发集团资深产品经理庄富任先生,负责主持Greenplum Chorus的整体研发工作

  庄富任先生是EMC中国卓越研发集团资深产品经理,负责主持Greenplum Chorus的整体研发工作,谈到本次发布的Greenplum Chorus平台,庄富任显然十分自豪:“Chorus是非常独特的,是一个更快、更容易、更敏捷的分析平台,同时是全世界靠前个基于大数据分析的社交协作的平台。”

  据介绍,Greenplum Chorus从探索数据、创建项目空间,创建独立“沙盒”,也就是自己独有的数据库,到做数据分析,都是一个协作的平台,任何人都可以参与进来一起做协作分析,且用户可以把自己的分析结果、程序代码、或者建议的分析模型发布出去,让大家可以重复利用,从而真正缩短了整个分析的流程。

  此外,Chorus还提供了开源的版本,使得Chorus与其他封闭的系统不同,可以很容易的实现第三方伙伴的整合,扩充整个大数据分析的功能。“Chorus的开源计划我觉得是重要且具有战略性的,企业可以自由的使用下载,开发符合他们自己需求的大数据分析工具。” 庄富任认为。

大数据时代的”Facebook”
▲EMC全球副总裁、中国卓越研发集团总经理李映博士

  EMC全球副总裁、中国卓越研发集团总经理李映博士则在发布会上强调,Greenplum Chorus是EMC中国研发主导的第一款产品,“从最开始想法产生,到市场需求收集,到产品基础研究,到后期的测试、开发,以及中国和全球的市场推广,都是在中国团队主导下,和美国Greenplum团队一起努力的结果。”

  “大数据已经成为业内的共识,中国研发集团很大一部分增长也是来自于大数据方面的研发。”李映博士介绍,EMC于2010年收购Greenplum,2011年年中,Greenplum在美国第一个全球研发团队就在卓越研发集团在北京开始正式启动,短短一年半的时间内,整个卓越研发集团都在做大数据相关的技术研究、产品研发、测试以及市场推广,加在一起有超过一百名研发工程师在为大数据相关的目标努力工作。

${PageNumber}

  Greenplum Chorus四大功能

  据介绍, Greenplum Chorus与Greenplum数据库、以及Greenplum HD一起构成了Greenplum的三个应用方向。庄富任先生介绍,Greenplum Chorus强调四大功能,包括:个人的沙盒、数据发掘、协作分析、开放架构。

Greenplum Chorus四大功能
▲庄富任对比传统的数据分析流程与Greenplum Chorus社交化分析流程,传统的数据分析流程非常冗长痛苦

  “以往在做数据挖掘的时候,流程是非常冗长和痛苦的。” 庄富任谈到:“从申请需求、到拿到数据资源,还需要将这些数据资源转化为系统能够识别的数据呈现给研究人员,并构建自己独有的数据库(也就是沙盒);开始分析后,还需要花费很长的周期才可能得到一个分析结果。”

Greenplum Chorus四大功能
▲Greenplum Chorus社交化分析流程

  Chorus可以根据数据分析需求快速的创建“个人沙盒”,创建的沙盒不会影响到原本的生产线上的数据存储资料;此外,Greenplum内建一个强大的企业级搜索引擎,使用者只需要很简单的把握几个关键字,就可以很快的搜寻出结果。

  同时,我们看到的数据不只是0/1或是很简单的文字描述,Greenplum可以把0、1转化成统计式的很简单的图形,可以让使用者很容易的看到整个数据的分布情形,搜寻数据变得越来越容易,越来越视觉化。最后,Chorus提供少有协作的功能,可以提供一个共享的平台和空间,帮助企业更快更及时的面对市场变化。

Greenplum Chorus四大功能
▲Greenplum整体系统结构示意

  “在整体的Greenplum产品示意图中,Greenplum Chorus是在最上面一层,是统一的界面,可以让协作者登录进来,甚至我们这个平台还可以对第三方合作伙伴开放,使合作伙伴也整合到我们的数据分析平台中,可以去访问底下的结构化数据,Greenplum Database等等。”庄富任介绍。

${PageNumber}

  中国大数据市场的三年目标

  “EMC是存储厂商出身,所以EMC最了解数据。”谈到EMC在大数据市场的竞争优势,蔡汉辉解释道:“除了EMC之外,几乎没有公司在谈用云计算技术去实现大数据的计算、挖掘、存储、管理,这是EMC非常独特的价值。”

  “我们是用云计算开放式、分布式、集群的技术去进行大数据的处理,这是EMC非常独特的,也是符合整个IT行业潮流趋势的。EMC一直以来倡导云计算与大数据的交汇,所提出的大数据解决方案,更多是从端到端的,对生命周期的管理、存储,到数据资源的分配、分析等等,是从下往上完整的解决方案。”

中国大数据市场的三年目标
▲“未来三年每年翻一番”是EMC规划的大数据市场战略目标

  “未来三年我们的大数据业务将每年翻一番”,蔡汉辉认为这个三年目标其实相对保守:“从2008年到2011年,我们业务增长了大约10倍左右,平均每年都是3倍的增长。今年我们2012年的目标其实也是去年的3倍,远远不止翻一番。”

  此外,蔡汉辉谈到了实现中国大数据市场的业务战略目标的几个关键点:第一,我们还会依赖我们目前核心的市场销售和咨询顾问团队,加强行业覆盖;第二,我们会在中国3000多家渠道合作伙伴中,重点选择、培养一些合作伙伴,帮助我们完成市场目标;第三,在中国我们有一个独特的优势,就是我们有一个立足本土的研发团队。这对于我们开拓大数据业务是非常有帮助的。

0
相关文章