技术开发 频道

SQL Server 2008 集成服务概述

面向服务的体系结构

SSIS 支持在数据流管道中使用 XML 数据,这类数据可以是来自磁盘文件的数据,也可以是通过HTTP 获取的 URL 数据。XML 数据能够被“细分”成为表格数据,然后SSIS就可以在数据流中轻松地操纵它们。这种对 XML 的支持能够与对 Web 服务的支持相互配合。SSIS 能够与控制流中的 Web 服务相互作用以捕获 XML 数据。

可以从文件中、从 Microsoft Message Queuing (Microsoft 消息队列任务,MSMQ)中以及通过 HTTP 从整个 Web 上捕获 XML 数据。SSIS 支持使用 XSLT、 XPATH 和 diff/merge 等操纵 XML 数据,而且可以将 XML 数据集成到数据流中。
这种支持使 SSIS 成为灵活的、面向服务的体系结构(SOA)的一部分。

数据挖掘和文本挖掘
 

SSIS 不仅在Analysis Services中深度集成了数据挖掘功能,它还提供文本挖掘组件。文本挖掘(也称为文本分类)涉及到识别业务类别与文本数据(单词和短语)之间的关系。它允许在文本数据中搜索关键字词,并且基于此自动识别“感兴趣的”文本。这能够进一步推动“关闭循环”操作的实施,从而实现业务目标,如提高客户满意度及提高产品和服务的质量。
按需数据源

SSIS 的独特功能之一是 DataReader 目标,用于将数据存入 ADO.NET DataReader 中。当数据流管道中包含此组件时,可以使用包含 DataReader 目标的包作为数据源,并将该数据源暴露为一个 ADO.NET DataReader。因此,不仅可以将 SSIS 用作传统的 ETL 加载数据仓库,还可以将它用作数据源,用以按照需要从多个源交付集成的、一致的数据,以及清理数据。例如,您可能会使用 SSIS 包作为其数据源,通过此方法帮助 Reporting Services 从多个不同的数据源上获取数据。

集成了所有这些功能的一个可能的应用场景是,从 RSS 源识别和提交有趣的文章作为常规报告的一部分。图7显示了一个通过 Internet 从 RSS 源获取数据的 SSIS 包,该 SSIS 包从一个 Web 服务上集成数据,执行文本挖掘以从 RSS 源上找到有趣的文章,然后将有趣的文章放入一个 DataReader 目标,最后在Reporting Services 报告中使用该文章。

从 ETL 工具的角度来看,该应用场景非常与众不同,因为它没有进行数据的提取、转换和加载。

SSIS 作为集成平台

SSIS 超越 ETL 工具之处不仅在于它可以使用非传统的应用场景,而且在于它是一个可以进行数据集成的真正平台。SSIS 是 SQL
Server Business Intelligence(BI)平台(开发端到端的双向应用)的一部分。

集成的开发平台

SQL Server Integration Services、Analysis Services 和 Reporting Services 都使用一个共同的基于 Microsoft Visual Studio ® 的开发环境,即 SQL Server Business Intelligence (BI) Development Studio。BI Development Studio 为 BI 应用程序的开发提供了一个集成的开发环境(IDE)。这个共享的基础结构支持在各种开发项目(集成、分析和报告)之间进行元数据级的集成。这种共享构造的一个示例是数据源视图(DSV),DSV 是数据源的脱机架构/视图定义,可应用于所有这三种项目类型。

IDE 提供与版本控制软件(如 VSS)等进行集成的设施,也支持基于团队的功能(如“签入/签出”),因此,它能够满足商业智能应用程序对企业级的、面向团队的、开发环境的需求。图 9 显示了一个包含集成、分析和报告项目的 BI Development Studio 解决方案。

这不仅提供了一个开发 BI 应用程序的单一位置,还可用于开发其他 Visual Studio 项目(使用Visual C#®、Visual Basic® .NET 等),从而为开发人员提供了一种真正的端到端的开发体验。

除了提供一种集成的 BI 开发环境以外,BI Development Studio 还具有对 SSIS 包进行准确的运行时调试的功能,包括设置断点的能力及对标准开发构造(如观察变量)的支持。一个真正独特的功能是数据查看器,当 Integration Services 处理数据流管道中的数据时,可以使用数据查看器查看多行数据。这种数据的可视化可以以常规文本网格的形式表示,也可以以图形(如散点图或条形图)表示。实际上,可以连接多个查看器,以便同时以多种格式显示数据。图 10 显示了使用散点图和文本网格表示可视化地理数据的一个示例。

0
相关文章