Hadoop是未来大数据的标准
谈到Hadoop的应用,童小军认为Hadoop从互联网应用发展而来,已经在互联网公司得到大规模应用。比如在百度有上万个节点集群,在淘宝有几千个节点存储几十个P的集群。目前,Hadoop在非互联网行业也开始了探索和使用,主要用于补充原有IOE平台处理海量日志的问题,用于数据仓库平台构建。其中电信领域已经比较成熟,在交通、电力等领域正在跟进,在技术选型上比较保守的银行业也在用Hadoop做备份,只是在总体商业模式上并无突破。
Hadoop平台如果要在非互联网行业得到大规模应用,在数据安全性和易用性上还有待改进,需要提供更多类似SQL的易用查询接口。在Hadoop 2.0出来后,希望Hive 2.0也能平台化发展,支持更多存储引擎,一个平台化的Hive会带来更多惊喜。Hadoop是未来大数据的标准,已发展成分布式的操作系统平台。

▲Hadoop大数据红象(RedHadoop)云腾公司创始人 童小军
对于Hadoop初学者,童小军建议要多实践、多分享,一定要热情和勇敢。Hadoop 有一个U型学习曲线,刚开始很难,如Hadoop安装、部署、调试和测试阶段。Hadoop需要多个组件配合,每个组件都有依赖,判断是否成功不容易。当度过难关进入试用期间就简单了,普通SQL、脚本、MapReduce 就能应对一些统计工作。当集群规模变大,集群平台化发展,深入到机器学习和各行各业深度定制,难度又增加了。其中最大的感触是要敢于尝试,敢于把系统部署上线。
作为这次大会内容的组织方之一,童小军希望这次大会能更深入到行业中,提供整个行业技术发展的同时,能挖掘更多行业的案例,树立更多行业成功运用Hadoop的典型。期待这次大会Hortonworks Jeff 带来的Hadoop2.0热潮,Hadoop爱好者更多的参与其中。
据悉,Hadoop中国技术峰会2013是国内基于Hadoop平台的第一次全产业链的大数据行业技术峰会,大会将围绕Hadoop生态系统展开全方位的技术分享、专题讨论与成果展示。大会议题将涉及以下七大方面:Hadoop技术创新、Hadoop基础架构部署与优化、虚拟化与Hadoop、Hadoop在互联网领域的应用、Hadoop在非互联网行业的应用、Hadoop与企业现有IT架构的整合、大数据创业与投资。
更多精彩尽在2013年11月22~23日的Hadoop中国技术峰会(China Hadoop Summit 2013),北京永泰福朋喜来登酒店。
现在报名即可享购票优惠。