技术开发 频道

DBA观点分享:大数据对传统数据库的影响

  【IT168 专稿】大数据趋势在2012年开始变得明显,Hadoop、NoSQL等技术的兴起,令传统数据库稳固的江山开始动摇。“以不变应万变”不再是大数据时代应有的策略,老牌数据库厂商在保持传统市场领先的基础上,不断拓展新市场。

  近日,ITPUB论坛以《大数据时代下传统数据库的改变有哪些?http://www.itpub.net/thread-1791263-1-1.html》为题发起讨论,话题围绕传统数据库为了应对大数据时代做出何种改变、传统数据库是否需要做出改变以保持领先地位、网友更看好大数据产品、数据库产品还是两者的结合等展开,以下为两位DBA对这一话题的观点。

  第一位是ITPUB论坛NoSQL版块的版主jieforest,他目前在长虹电器股份有限公司担任技术工程师。他认为大数据不仅表示海量数据,还表示结构化数据和非结构化数据。而传统数据库在处理结构化数据很擅长,但在处理非结构化数据方面就有些捉襟见肘了。如今,大数据的影响已经逐渐渗透到各行各业,对未来的科技和经济发展必将带来深远影响。

DBA观点分享:大数据对传统数据库的影响

  大数据时代对传统数据库的影响主要有:

  1、传统数据库纷纷改进自身,兼容大数据技术。

  Hadoop可以说是大数据事实上的标准,各传统数据库厂家纷纷集成Hadoop架构,作为自身数据库/云数据库/数据中心等解决方案的一部分。微软在Windows Azure中集成了Hadoop,并推出了用于大数据管理、分析和挖掘的Hadoop发布版HDInsight。

  2、传统数据库厂家细分产品线,面向大数据推出新型软硬件产品。

  比如SAP公司针对大数据的实时海量数据处理需求,推出了SAP HANA这样的软硬件一体的解决方案。Oracle推出新型数据库机Exadata,目前已经发展到第二代了。

  另外一位是DB2专家王亚南,他毕业于南开大学计算机网络专业,曾参与过多项大型政府项目信息化建设,现主要负责公司内部数据( 仓) 库、ETL、OLAP 设计、开发、调优和维护。他认为信息即服务! 大数据是真实的,既不要忽视也不要害怕,将大数据整合到企业创新平台中, 制定包含大数据的企业分析战略, 使用大数据来提高企业的竞争优势 !

DBA观点分享:大数据对传统数据库的影响

  EDW与BigData简要对比:

  1、EDW中的数据是清洗过的,容易理解的,有意义的数据;而BigData中数据是未清洗过、需要经过 "探索" 来发现有意义的数据;

  2、EDW建立在关系模型基础上,是面向主题的;而BigData则是未建模、非(半)结构的;

  3、EDW:结构化、可分析、逻辑性;BigData:创造性、整体思维、知觉。

  BigData并不是对传统EDW的替换方案,而是一种补充和延伸,整体混合架构构成一个更广义的Internet级别的海量数据仓库。而两者 "互联互通" 才是关键!(Hadoop最初开发的并不是为BI或SQL执行来应用的)

  混合架构的特点:

  1、混合架构完成海量数据处理和存储;

  2、结合关系型数据库和Hadoop文件存储能力解决海量数据存储;

  3、业务核心数据(最近的CDR、客户资料等)存放到DW中,海量历史数据(如网络数据互、WEB日志、CDR数据)存储放到Hadoop平台中;

  4、关系型数据库提供常用的SQL接口,支撑主流前台工具,前台工具通过关系型数据库与Hadoop的接口,访问Hadoop数据;

  5、关系型数据库给前台分析报表和OLAP提供数据,提供高效的复杂查询服务;

  6、BigData技术平台,完成数据的ETL和海量数据分析和挖掘,提供高效的海量数据处理服务。

  目前DW与BigData结合的潜在部署方法:

  1、BigData作为DW的源,大数据平台可以对大量的非结构化或半结构化数据进行筛选,捕获可增强DW中现有企业数据的相关信息。而在DW中,传统业务智能、查询、报告编写工具可以处理存储在BigData中的原始数据的提取、汇总和转换部分。

  2、 BigData作为DW的查询就绪存档,被频繁访问的数据就可以在DW中进行维护,而 "很少访问" 或过时信息可卸载至BigData中。

  该方法允许企业管理与其现有数据管理平台同样大小的数据,而同时又可满足其现有应用程序需求。通过将不常查询的数据卸载至BigData,可以保留应用程序在偶尔需要或突然需要使用数据的情况下对数据的访问。

  让数据说话,让数据驱动决策 !

0
相关文章