二、用SQL Warehouse 完成数据抽取、转换、装载工作
当在DWEOLAP数据库中创建好星型模型后,下边就要完成数据抽取、转换、装载工作,我们这里通过DWE组件中的SQL Warehouse来完成。
采用SQL Warehouse来完成数据抽取、转换、装载工作的主要步骤包括:
1. 在Design Studio中创建数据设计项目,用来创建数据物理模型,在SQL Warehouse中,数据的抽取、转换是要针对物理模型来完成的。
2. 在Design Studio中创建数据仓库项目,并关联相应的数据设计项目,来指定相应的物理模型。SQL Warehouse设计数据的抽取、转换流程都是在数据仓库项目中完成的。
3. 在Design Studio中设计数据流程,完成数据的抽取、转换及装载工作。
4. 在Design Studio中设计控制流程,完成数据流程的控制。在SQL Warehouse中,ETL流程的调度、运行都是基于控制流程来完成的。
5. 在Design Studio生成数据仓库应用程序,为ETL流程的部署做准备。
6. 在Admin Console数据仓库管理工具中,部署ETL的控制流程,并实现ETL流程的调度及运行,即日常的运行工作。
下图,详细说明了上边的流程:

SQL Warehouse提供GUI界面来完成ETL流程的设计及运行工作,我们在设计时,只需要鼠标的拖拽工作就可以完成大部分开发工作。SQL Warehouse中提供了大量的数据转换功能函数,使数据转换工作变得更见简单。下边图示列举了一些典型的数据转换功能函数:



创建一个数据设计项目DWEOLAP,

创建物理数据模型并通过反向工程获得DWEOLAP数据库模型,


得到如下数据库模型,每一个模型对应一个数据库:




当创建完数据流后,我们要在DWESQW项目中创建控制流dwe_ctrl,

创建完相应的控制流后,在Design Studio中创建数据仓库应用程序,为部署做准备,

在Admin Console中,部署数据仓库应用程序,并运行或调度相应的控制流,

当dwe_ctrl控制流运行成功后,我们便将数据装载到了定义的星型模型的表中。