技术开发 频道

SQL Server 2008 商业智能详解

统一数据存储和访问

大多数公司拥有多个业务系统,每一个业务系统都有其专用的数据存储。尽管你可以从独立的应用程序中生成报表,并对其所包含的数据进行分析,但只有通过合并企业内的异构数据,才能创建一个集中的用于生成报表和分析的商业数据源。
为数据分析和生成报表整合企业数据

SQL Server 2008支持两种常见的方法来为数据分析和生成报表整合企业数据:

数据仓库。针对企业级数据的存储,它的数据来自企业中不同的数据源,并与其同步。这种方法的主要优点是你可以针对数据分析和报表的性能来设计数据仓库,而对数据源的业务应用程序不会造成性能上的影响。该方法的另外一个优点是可以将来自多个数据源的数据清理并整合到一个与真实数据保持一致的、独立的数据仓库中。

数据源抽象。SQL Server 2008分析服务可以通过创建数据源视图来提供针对一个或多个数据源的抽象层。然后你可以将这个数据源视图作为分析服务、集成服务和报表服务的独立数据源。有了这个数据源视图,当进行数据分析和生成报表时,会从后台的数据源系统获取数据。这个方法的主要优点是可以对业务应用程序中的数据作实时分析。此外,数据源视图通过所增加的抽象层,可以创建合适的名称来替代冗长或含义模糊的表名。

以你所希望的方式来处理所有数据

无论采取哪种方法统一业务数据,SQL Server 2008对关系型数据和非关系型数据提供了强大支持,并为开发人员和管理员提供可以对非结构化数据实现高效存储和管理的数据类型,例如文档和图片这样的数据类型,所以用户可以采用最适合其业务的格式来存储、管理并分析数据。

SQL Server 2008增强了对XML 数据存储以及FILESTREAM 数据类型的支持,FILESTREAM 数据类型使得大型的二进制数据可以存储在文件系统中,并通过事务一致性来保证数据库的完整性。此外,删除了对用户定义的数据类型的大小限制,从而可以超过在之前的SQL Server版本中的8 KB 限制。对空间和位置数据类型的支持使得可以存储和分析符合行业标准的地理信息数据。
集成企业所有的数据源

SQL Server 2008数据源视图可以集成数据并访问从异构的企业级数据存储中获得的数据,例如SQL Server、Oracle、DB2和Teradata。这些视图还提供了企业范围内的联机分析处理存储,而且在SQL Server 集成服务中对不同数据源的支持意味着你可以从现有的业务应用程序中提取数据。因此,无论是通过数据源视图建立一个抽象层,还是使用ETL来同步专门用于分析和报表的数据仓库,统一企业所有的数据源数据都是很容易实现的。

此外,通过对Web services和Microsoft .NET框架的支持,SQL Server 2008可以跨平台、跨应用程序、跨编程语言实现协同工作,因此你可以通过集成异构数据源来实现对新系统以及现有系统的投资回报率最大化。SQL Server 2008还支持已有的和新兴的开放标准,例如HTTP、XML、SOAP、XQuery和XSD,从而进一步方便了企业系统间的通信。
数据仓库性能

SQL Server 2008提供了一个全面且可伸缩的数据仓库平台,使得企业可以更快的将数据整合到数据仓库中,这样就可以扩大并管理不断增长的数据量和用户数量。
优化ETL过程

数据仓库一般通过ETL 过程从数据源系统中获得数据并进行组装和更新。数据最初加载到数据仓库之后,会定期对源系统中新的数据和更改的数据进行刷新,以确保数据仓库中的数据是最新的。

SQL Server 集成服务提供了一个全面的平台,你可以从不同的数据源系统中提取数据,并对数据或其结构、格式做任意修改,然后将转换后的数据加载到数据仓库中。在ETL 过程中执行查找来对源数据和数据仓库中的数据进行匹配是一个很常见的操作,在SQL Server 2008中查找的性能得到了显著提升,并可以在非常大的数据表中执行。

为了帮助跟踪数据变化和确保数据仓库一致性,SQL Server 2008推出了变更数据捕捉(Change Data Capture, CDC)功能,将更新记录在变更表中,从而很容易标识被更改的行并确定更改的细节以及更改的原因。

高效管理硬件资源

通过支持数据压缩,SQL Server 2008可以更有效地存储数据并降低存储成本。另外,对于具有输入/输出限制的大型负载,压缩可以显著提升其性能。SQL Server 2008自身还支持针对备份的压缩。此外,VARDECIMAL数据类型和SQL Server 2008中的新引入的稀疏列,通过降低大型表(例如数据仓库中常见的由数字或空值所组成的表)所需要的空间,从而最大限度的利用磁盘存储资源。

除了在数据存储方面提高效率,SQL Server 2008还可以动态分配通过地址窗口扩展(Address Windowing Extensions, AWE)所映射的内存,在Windows Server 2003数据中心版中可以支持64GB内存,在64位版本的操作系统中可以支持2TB内存,从而支持大型数据仓库环境。

SQL Server 2008还推出了Resource Governor,它使得管理员可以为不同的工作负载定义资源限制和优先权,从而使得并发工作负载可以提供稳定的性能,并可以预先对资源竞争问题进行管理。
优化数据库性能

SQL Server 2008提供了高性能的关系型数据库引擎,可以建立高效的数据仓库解决方案。一些创新功能(例如针对星型架构的优化以及索引和数据结构调优的辅助工具)使得SQL Server成为数据仓库解决方案的首选产品,同时在SQL Server 2008中推出了MERGE Transact-SQL语句,开发人员可以更有效地处理普通的数据仓库场景,例如检查一行是否存在然后执行插入或更新。此外,对GROUP BY条件语句进行了扩展,使得用户可以在一个查询中定义多个组。Grouping Set生成了一个单独的结果集,这与对不同分组的行执行UNION ALL 操作是等价的,它使得聚合查询和生成报表更加容易和快速。

SQL Server 2008支持分区表,帮助你管理并优化大型数据表的性能。通过分区表并行功能,你可以显著优化数据仓库。
 

0
相关文章