【IT168 技术文档】针对数据仓库、商业智能应用,IBM提供了全面的、业界领先的解决方案。软件方面,提供了集成的、端到端的解决方案DWE (Data Warehouse Edition);硬件方面,IBM提出了Balanced Warehouse解决方案,它根据用户预计的数据仓库规模,为用户提供预先配置的、经过优化的、可以扩展的硬件配置方案,包括服务器的型号、配置,存储的配置,网络的配置,可以为用户提供合理的硬件选型;在数据仓库模型方面,IBM提供了针对银行、电信、保险及零售业的数据仓库模型,可以为用户提供针对行业应用的模板,加速行业应用建模。
本文,主要为大家介绍DWE (Data Warehouse Edition)解决方案,特别是如何利用DWE功能部件快速建立数据分析应用,以帮助大家快速掌握利用DWE开发分析应用的基本方法。
DWE软件包是一个集成的解决方案,它包括了实现一个数据仓库应用所需的各种功能部件,

-用于数据抽取、转换、清洗、装载的软件 SQL Warehouse,它主要实现基于数据库的数据转换工作。
- 用于构造多维数据模型的功能部件OLAP,它主要完成构建多维数据模型,并将多维数据模型保存到数据库中,使数据库成为真正的多维模型感知的数据库系统,同时,可以完成不同分析工具之间的多维模型的元数据交换。另外,它还可以针对多维数据模型提供优化功能,通过提供建立数据汇总表的功能来优化数据分析效率。
- 用于查询、报表及OLAP分析的前端展现工具Alphablox,它是一个基于J2EE架构的多维分析工具,主要定位于提供嵌入式的、可定制化的应用。用户开发Alphablox应用,主要是开发一些jsp页面,同时嵌入Alphablox提供的用于多维分析的各种Blox,开发周期短,可定制能力强。
-用于数据挖掘的功能部件Mining,它通过Modeling、Visualization及Scoring等功能实现数据挖掘模型的建模、可视化展现及实时利用模型为新数据评分的功能。Mining功能部件提供了业界丰富的数据挖掘算法,并实现了将数据挖掘功能嵌入到工作流应用中,扩展了数据挖掘应用的应用范围。
-提供了数据仓库数据存储软件DB2,它提供了业界领先的数据可扩展能力,可以支持TB级海量数据仓库系统,并通过查询并行能力、优化器算法、MQT汇总表等方式来提高查询的效率。
-提供了集成的、基于eclipse的数据仓库设计工具Design Studio,它可以实现数据仓库抽取流程的设计、挖掘模型的设计、多维分析建模。
-提供了统一的、集成的数据仓库管理工具Admin Console,它是一个基于Web界面的管理工具,可以完成数据抽取流程的管理、调度,多维模型的管理及优化,挖掘模型的管理及前端分析工具Alphablox的管理。
下边,我们通过一个简单的“销售分析”的例子来介绍一下如何利用DWE功能部件快速建立数据分析应用。
“销售分析”模型主要包括3个维度:
-Locations维度:地区维度,包括全国—省—城市三个层次;
-Times维度:时间维度,包括年—月—日三个层次;
-Products维度:产品维度,包括产品类别—产品两个层次;
事实表Fact::包括销售额及销售数量两个量度;