另外一位是DB2专家王亚南,他毕业于南开大学计算机网络专业,曾参与过多项大型政府项目信息化建设,现主要负责公司内部数据( 仓) 库、ETL、OLAP 设计、开发、调优和维护。他认为信息即服务! 大数据是真实的,既不要忽视也不要害怕,将大数据整合到企业创新平台中, 制定包含大数据的企业分析战略, 使用大数据来提高企业的竞争优势 !

EDW与BigData简要对比:
1、EDW中的数据是清洗过的,容易理解的,有意义的数据;而BigData中数据是未清洗过、需要经过 "探索" 来发现有意义的数据;
2、EDW建立在关系模型基础上,是面向主题的;而BigData则是未建模、非(半)结构的;
3、EDW:结构化、可分析、逻辑性;BigData:创造性、整体思维、知觉。
BigData并不是对传统EDW的替换方案,而是一种补充和延伸,整体混合架构构成一个更广义的Internet级别的海量数据仓库。而两者 "互联互通" 才是关键!(Hadoop最初开发的并不是为BI或SQL执行来应用的)
混合架构的特点:
1、混合架构完成海量数据处理和存储;
2、结合关系型数据库和Hadoop文件存储能力解决海量数据存储;
3、业务核心数据(最近的CDR、客户资料等)存放到DW中,海量历史数据(如网络数据互、WEB日志、CDR数据)存储放到Hadoop平台中;
4、关系型数据库提供常用的SQL接口,支撑主流前台工具,前台工具通过关系型数据库与Hadoop的接口,访问Hadoop数据;
5、关系型数据库给前台分析报表和OLAP提供数据,提供高效的复杂查询服务;
6、BigData技术平台,完成数据的ETL和海量数据分析和挖掘,提供高效的海量数据处理服务。
目前DW与BigData结合的潜在部署方法:
1、BigData作为DW的源,大数据平台可以对大量的非结构化或半结构化数据进行筛选,捕获可增强DW中现有企业数据的相关信息。而在DW中,传统业务智能、查询、报告编写工具可以处理存储在BigData中的原始数据的提取、汇总和转换部分。
2、 BigData作为DW的查询就绪存档,被频繁访问的数据就可以在DW中进行维护,而 "很少访问" 或过时信息可卸载至BigData中。
该方法允许企业管理与其现有数据管理平台同样大小的数据,而同时又可满足其现有应用程序需求。通过将不常查询的数据卸载至BigData,可以保留应用程序在偶尔需要或突然需要使用数据的情况下对数据的访问。
让数据说话,让数据驱动决策 !