技术开发 频道

Hadoop大会前夕:专访华为副总裁李三琦

        【IT168 评论】由中国科学院计算技术研究所主办的 Hadoop中国2011云计算大会将于12月2日至3日在北京会议中心召开,这将是Hadoop in China社区的一次年度技术盛会! 大会特别邀请了Condor的创始人University of Wisconsin–Madison的Miron Livny教授、以及来自Google、Facebook等国内外著名互联网公司和IT企业的学者和资深开发人员到场演讲并进行技术交流,部分专家是首次来中国访问。Hadoop中国2011云计算大会专题信息:http://hadoop.it168.com/。大会报名注册地址:http://hadoop.it168.com/index3.html

  全球领先的信息与通信解决方案供应商华为在Hadoop重要贡献公司名单内,排在Google和Cisco的前面,说明华为公司也在积极参与开源社区贡献。11月10日,记者就大家关心的一些Hadoop话题采访了华为副总裁、IT产品线的CTO李三琦先生。以下是访谈部分内容:

Hadoop大会前夕:专访华为副总裁李三琦

  1. Yahoo新成立的Hadoop公司Hortonworks,最近发布“Yahoo对Hadoop贡献”一文,标榜Yahoo是Hadoop最大贡献者,Cloudera CEO很不满,又爆出更为细致的分析数据, 从中,我们可以清晰看到各公司参与Hadoop参与情况: 微软近日宣布开发一个兼容Windows Server与Windows Azure平台的Hadoop开源版本。IBM宣布在Hadoop上建立新的存储架构,作为群集运行DB2或Oracle数据库,目的是让应用程序,支持高性能分析,数据仓库应用程序和云计算的目的。 EMC也推出了世界上第一个定制的、高性能的Hadoop专用数据协同处理设备——Greenplum HD数据计算设备,为客户提供了最强大、最高效率的方法,充分挖掘大数据的价值。互联网搜索巨头百度也在考虑使用Hadoop。不过,出于性能与安全的考虑,百度在采用Hadoop架构的时候,将Hadoop计算层进行了重新编写。在2011Openworld大会上,甲骨文宣布发布了Big Data 机,它采用了NoSQL数据库和Hadoop框架,并且成功的将其商业化,用于大数据分析。华为公司在Hadoop重要贡献公司名单内,排在Google和Cisco的前面,说明华为公司也在积极参与开源社区贡献。为什么华为会如此关注开源社区,特别是Hadoop?

  李三琦:我们公司也有很多核心员工是来自雅虎以及Google,这里我想强调的是Open Source Community非常重要,尤其对云计算及电信和传统IT行业都有很大的作用、由此形成一个强大的ecosystem。我们是在这个大平台上来充分发挥自己的作用,两年以来我们加入了很大的投入,成立了开源软件中心统筹构筑开源战略和能力,并在开源项目和相关技术领域加大投入,其中Hadoop就是我们的投入的一个领域、不仅是Hadoop本身形成了一个产业,还包括很多开源工具、开发框架。华为非常重视这个领域,这也是华为在创新过程中的一个很大转变,希望利用Open Source,站在巨人的肩膀上,与此同时我们也会大力支持开源项目,由此产生的影响也是深远的。

  我们跟Cloudera、Hortonworks有很多的互动,比如我们邀请了Hadooop最早的Contributor来做Hadoop方面的主题演讲,形成了很好的合作关系。我们在积极主动推动Open Source Community,这对华为、云计算、以及对今后的创新型商业模式都会产生正面的深远影响。像最近的微软、Oracle、EMC都相应的对Hadoop提供了一些支持,主要是为了更好的发展产业链。这些传统IT公司通过收购也好,或者其它方式也好,也都认识到了这方面的重要性。

  同时这也证明了开源是一个大势所趋,相应地会产生很多新的商业模式。两年半的时间里,我们在Hadoop方面的投入,使得我们站在巨人的肩膀上,与IBM、Oracle站在了统一的起跑线上,这就是开源带来的好处。海量的数据,对BI、企业也好,谁拥有数据才是关键。现在的IT企业,大多是关系型数据库,具有一定的局限性,这种数据是分裂式的,没有很好地被挖掘出来,这就是为什么Google、Facebook、 Linkedin、Twitter用到大数据分析引擎产生新的商业模式。同样,这些在消费市场中产生的影响会很快进入到IT产业、以及其它各个行业,从而产生各种新的商业模式。

  我们支持Open Source,我们也支持Open API,在新的产业链、新的云计算行业里,我们致力于全方位的合作的模式,而非传统的垂直集成模式。

  2. 我们知道,云计算大潮正在席卷全球.10月31日,全球领先的信息与通信解决方案供应商华为,在中国深圳隆重举行 “2011华为云计算大会暨合作伙伴大会”, 吹起强势发力云计算的响亮号角。华为正在经历转型期。不再甘愿只是作为传统通信设备巨头,同时希望在IT市场也有所斩获。 10月31号华为宣布成立了由华为董事会直接投资的IT产品线。作为IT产品线的CTO,您在接收媒体采访时也表示,华为已经将云计算列为未来十年的核心战略,并将持续增加对云计算领域的投入。据悉,目前华为在云计算领域投入的研发力量已经超过公司整体研发力量的10%。那么华为会选择进入IT市场?为什么是这个时机,而不是更早或者更晚?

  李三琦:华为认为,IT不再是传统的IT,CT也不是传统的CT,而大家都在进行ICT的转型,这就是云计算带来的新的商业模式。华为这十几年的成功也正是得益于转型。大家有目共睹的是网络运营商的转型,包括新的技术、新的市场。华为与运营商一起经历了三次成功转型。即从TDM网络到IP网络,从Voice到Data,从固网到移动网的转型。这三次转型给了我们一个发展的机会,使华为从网络系统成长起来。华为的终端产业,随着3G的日益普及与移动互联网的发展,华为将系统优势延展到消费者,再延展到业务和应用,提供端到端的用户体验。

  

        【IT168 评论】   华为“端管云”战略,仔细分析就是开放平台,构建以客户为中心的生态系统。端是指终端,比如智能手机、TouchPad、家庭媒体中心、云桌面等, “管”是华为通信设备,基础设施,为用户提供内容暂存处理、路由选择,以大大改善用户体验。而最上层的业务是与云计算息息相关,这就不难理解华为为什么会选择进入IT市场,而且大多传统的IT、CT也都在向以“端管云”为基础的ICT转型。

  是不是选择这个时机进入是最好的呢?我们选择何时进入,在时机上也酝量了很久,我们需要在组织上重新整合。这几年在运营商市场中的大幅提升,使得华为在各方面的能力有很大的提高。无论是在大环境下,包括云计算、端管云,还是自身条件,华为在软件、硬件方面都有相当程度的积累,而且,在今后新的ICT领域里, 我们会有新的团队、人才招聘,包括国内外的团队,比如Yahoo、Google、IBM、HP,我们会加大整个产业的投入。

  3. 我们知道目前的云计算厂商很多,风起云涌、而且很多都是IT巨头,比如IBM,HP,Google,微软,Oracle.那么作为“新兵”的华为在面对上述这些“老兵”,在云计算方面有哪些优势呢?未来IT产品线在研发投入,市场开拓,产品创新方面有哪些计划和战略?预计10年后,华为的云计算将达到什么目标?

  李三琦:华为作为一个“新兵”进入这个领域,我们一方面要学习老兵的优势,另一方面我们要向Google、Facebook、Amazon等一些新型企业学习。我们要学习它们的商业模式、系统集成、咨询、创新等,很多方面值得我们学习。

  云计算的出现将使IT市场更加变化莫测,商业模式也将相应地发生很多变化,我们的优势之一在于端管云优势。我们已在管道市场提供全球化的服务,在电信市场拥有全球化的市场。我们和运营商之间保持良好的互动,这是我们的一个长处。端管云是我们的一个独特的优势所在。其次,我们有自己的芯片公司、很强的硬件、很强的软件开发能力。总之,新的商业模式和潜在的市场,要成功的话,都要转型。不光是我们在转型,实际上巨头公司也在纷纷转型,比如通过大量收购新产品、新技术、新市场,我们是在跟巨头学,巨头也在转型,我们也在转型,大家都在转型,新的技术、市场、商业模式,推动着转型的浪潮。

  在云计算新领域中,华为一直主张用Open Source也好、用标准化也好,积极推动这个产业的生态链的形成。对于标准化组织,我们在积极参与、大量投入。我们是做通讯起家,自然对产业的标准很重视,在新型的ICT产业,云计算行业要想做成功,需要开放、合作、支持Open API、开源,这样才能形成一个很大的Eco System,才会带来很大的潜力。华为在这方面具有长期的战略眼光,我们致力于成为ICT行业的领导者。

  4.在云计算应用方面,华为非常关注用户体验,积极深入应用实践。本着“开放合作,化云为雨”的理念,华为整合自身强势资源促进各个行业应用向云计算迁移,推动云计算在各个行业和领域的落地,覆盖了电子政务、医疗、教育、物流等行业,为各行业的信息化腾飞做出了贡献。作为华为的副总裁,您能谈一下华为在企业解决方案方面的前瞻战略吗?华为主要为企业提供什么样的数据解决方案,与其它的厂商相比,我们的竞争优势以及定位在哪里?

  李三琦:Cloud OS是我们投入比较大的一个领域,目前已在研发中;云的管理系统是另一个投入领域,它不仅仅是一个虚拟计算,还包括虚拟存储、虚拟网络的统分资源管理。在先进的国家里,一个数据中心,80%以上用于软件和管理的投入成本。每在软件花一块钱,要花4块钱来整合定制化及管理,所以我们专注于云操作系统(包括虚拟化、中间件)做平台、云管理系统、硬件软件的融合架构。

  我想Oracle在IT做的很成功,聚焦在关系型数据库、垂直整合方面。ICT转型中会发生巨大的变化,今后的数据库最大的应用是NoSQL,大量是非结构化的数据库,这是传统数据库所无法解决的,我们接触到的用户很多在寻找低成本、可扩容的解决方案。另一方面很多数据寄望于低成本、大容量的非关系数据库,而不再是传统的关系型数据库。我们注重点不是在传统的关系数据库,我我们在今后的发展中更注重的是基于NoSQL大数据分析。

  5.如今,“大数据”这一术语在IT经理人中变得越来越流行。美国国家海洋与大气管理局NOAA利用“大数据”进行气象、生态系统、天气和商务研究。《纽约时报》使用“大数据”工具进行文本分析和Web信息挖掘。迪斯尼则利用它们关联和了解跨不同商店、主题公园和Web资产的客户行为。“大数据”不仅适用于大型企业,而是适用于各种不同规模的企业。例如,通过评估某位客户在网站上的行为,来更好地了解他们需要什么支持或寻找什么产品,或者弄清当前天气和其他条件对于送货路线和时间安排的影响。您是怎样看待“大数据”?为什么我们现在提出大数据?难道过去的数据不够大吗?

  李三琦:我们在两年前就是投入在大数据方面。交通、教育、医疗、政务、智慧城市,这些都离不开大数据,这些数据以前是分裂式,现在数据变得越来越多。比如Google无人驾驶车,一旦在云里把所有的数据相关联起来,用算法进行精准查询,就能实现真正的无人驾驶。面对“大数据”,Hadoop为揭示深奥的企业与外部数据的关键内幕提供了基础。从技术上看,Hadoop分布式文件系统(HDFS)保证了大数据的可靠存储,而另一Hadoop核心组件MapReduce则提供高性能并行数据处理服务。这两项基本技术提供了一个使对非结构化和复杂“大数据”的快速、可靠分析变为现实的基础。这两项基本技术还在进步日新月异地发展。

  6.Hbase作为开源的非结构数据库,与传统的关系数据库相比,竞争优势在哪里?目前还有哪些缺陷?未来Hadoop会遇到哪些挑战?

  李三琦:这是两种完全不同的应用。关系数据库需要处理大量的Transaction,要求保持数据的实时一致性。Google 搜索引擎在不同时间、不同地点搜索的结果是不一样的,这就不要求实时的一致性,这就是非关系型数据库。它们不太要求实时的一致性,但是具有分布式特点,所以在计算能力、存储能力、灵活性方面不太一样。它们的应用不一样,算法不一样,一个是基于Column,支持横向扩展。一个是传统数据库基于Row。Hadoop在做分析的时候,批量处理数据,不能做Real-Time 分析,而是靠累计的数据来进行分析,我们也在从事实时大数据分析技术的研究。

  总结:

  我们所处的时代是,左手以IT为核心的数据中心,右手以CT(Communication Technology)为核心的网络中心。而云计算策略使得CT、IT走到ICT的融合。我们希望华为的未来云计算战略能够乘风破浪,作为民族企业在与外企的竞争中,走的越来越好,成为华人的骄傲。

  个人简介:

李三琦教授毕业于北京邮电大学,在加拿大Waterloo大学取得博士学位,后在University of Texas at Austin任终身教授,先后培养了20位博士生。三琦教授在Internet流量管理工程、电信网络架构及控制方面是通信业界资深权威,先后在IEEE等核心刊物上发表论文超过160篇。三琦教授还致力于研究与产业的结合,先后创立了GaoHong、Santera Systems Inc、Spatial Wireless等软交换、3G应用等业界知名的Startup公司。2009年三琦教授先后为Cisco、AT&T、Verizon、Samsung、Ericsson等公司提供技术咨询,2009年初三琦加入华为,任核心网产品线CTO,2010年中开始任Data Center & Media Network产品线总裁,负责端到端的数据中心和媒体网络的技术、架构及策略。2011年10月华为成立IT产品线,李三琦任IT产品线CTO。

0
相关文章