技术开发 频道

Hadoop峰会:南航航空大数据技术应用

  【IT168 现场报道】2013年11月22-23日,作为国内知名专注于Hadoop技术与应用分享的大规模行业盛会,2013 Hadoop中国技术峰会(China Hadoop Summit 2013)于北京福朋喜来登集团酒店隆重举行。来自国内外各行业领域的近千名CIO、CTO、架构师、IT经理、咨询顾问、工程师、Hadoop技术爱好者,以及从事Hadoop研究与推广的IT厂商和技术专家将共襄盛举。

  Hadoop中国技术峰会由China Hadoop Summit专家委员会主办,由IT168、ITPUB、ChinaUnix协办,渠达传媒负责承办。本届大会将秉承“效能、应用、创新”为主题,旨在通过开放、广泛的分享和交流,着力于促进中国企业用户提高应用Hadoop的能力和水平,降低Hadoop技术应用门槛和投资预算门槛,推广大数据的应用价值。

Hadoop峰会:南航航空大数据技术应用
▲南航天合高级架构师于英

  在第二天下午的企业大数据实践主题论坛中,南航天合高级架构师于英带来《南航航空大数据技术应用》的演讲,分享了南航大数据的发展,以及大数据服务平台和大数据处理平台的架构设计。

  于英表示,传统的关系数据库在支持非结构化数据分析挖掘上存在技术上的瓶颈,受到关系范式的影响,扩展性和并发性比较差,成本较高,无法支持海量数据。但是大数据的环境下需要一个海量、高效的数据库,满足高扩展性、高可用性和低成本的需求。

  谈到南航为什么做大数据项目,他表示,南航目前拥有亚洲第一、世界第三的旅客量,基于原来IOC、IOE的模式支撑数据存在很大的瓶颈,所以南航才开始逐步基于开源做大数据应用支撑。航空业会产生大数据,例如波音787每飞一个来回都会产生几TB的数据。除此之外,南航还会对客户信息做大量分析,用于精准营销和产品设计。

Hadoop峰会:南航航空大数据技术应用
▲南航大数据总体架构

  NoSQL作为大数据开源产品的代表,有以下优点:大数据量、高性能和高可用、弹性扩展能力、灵活的数据模型和低成本。但是又存在很多不足,例如产品成熟度不足:不能支持事务、多表查询、聚合查询等;支持力度不足:大多为开源项目,没有能力提高全球服务支持,需要用户自行解决;管理功能缺陷:使用门槛较高,需要大量的技能来支持安装、使用、维护和调优。

  据于英介绍,南航的大数据平台分为两个部分,分别是大数据服务平台和大数据处理平台。其中大数据处理平台基于Hadoop建立起来,成功的解决了南航的大数据存储问题。

Hadoop峰会:南航航空大数据技术应用
▲点击进入2013年Hadoop中国技术峰会报道专题

1
相关文章