技术开发 频道

SQL Server 2012的五个商业智能特性

  【IT168 评论】SQL Server 2012交付了一些新特性,增强和扩展了的功能远胜于SQL Server 2008和2008 R2。这一点在商业智能(BI)领域特别明显,因为BI领域在报表和分析功能方面的改进比以往任何时候都要多。组织如果要改进其BI,需要特别注意以下五个SQL Server 2012商业智能特性。

  BI语义模型

  SQL Server 2012引入了BI语义模型(BI Semantic Model, BISM),它给支持的分析和报表平台提供了一个用于交付BI的概念框架。虽然BISM本身并不是一个物理实体,但是它提供了在SQL Server Analysis Services (SSAS)和PowerPivot for Excel中创建物理模型的结构。在SSAS中,我们可以创建两种BISM模型:多维模型和表格模型。在PowerPivot for Excel中,我们只能创建表格模型。

  多维模型通常情况下都是业务模型。它与早期的SSAS版本的统一多维模型(Unified Dimensional Model, UDF)保持一致,将数据组织为库、维度和层组。与UDF类似的是,多维模型使用多维表达式(Multidimensional Expressions, MDX)语言访问多维数据存储,提供了一个执行复杂分析操作的强大环境。

  SQL Server 2012的BISM实际上是表格模型,与多维模型不同,它将数据组织为包含行与列的表格,这与关系数据库很像。此外,表格模型使用数据分析表达式(Data Analysis Expressions, DAX)语言访问数据,它可以查询各种数据源,其中包括关系数据库、SSAS库、文本文件和PowerPivot工作薄。表格模型是在SQL Server 2008 R2的PowerPivot for Excel和PowerPivot for SharePoint版本中引入的。这个模型使用xVelocity引擎(前身是VertiPaq引擎)将数据缓存在内存中,同时使用非常先进的压缩和扫描算法支持高性能分析。

  字段存储索引

  xVelocity技术,即非聚簇字段存储索引是我们要介绍的第二个SQL Server 2012商业智能特性。与常规非聚簇索引类似,字段存储索引定义在一个或多个表字段上。与非聚簇索引不同,这些数据保存为字段型格式。换言之,每一个索引字段的数据都存储在索引中属于自己的字段里。如果一个表的记录行超过百万,那么索引会被分割为片段,但是字段型结构将会保留。另一方面,非聚簇索引以记录行的方式存储数据。

  除了字段型存储,字段存储索引还使用xVelocity的高级存储和压缩功能。这些特性加在一起可以显著提升那些必须检索和处理大数据集的查询,这种查询通常发生在数据仓库中,而其中的数据通常都经过分组、过滤、汇总并跨越多个表。它通常可以大大提升性能,因为只有适用的字段才能够加载到内存中,而加载到内存的数据又经过高效压缩,而且针对这些数据的查询还专门对分析操作进行了优化。

  数据质量服务

  只有正确的数据,才能支持高效的挖掘、分析、报表和仓储。但是,从多个应用了不同标准的系统查询数据通常会产生错误、混乱和不一致性。这时就是数据质量服务(Data Quality Service, DQS)发挥作用的时候。DQS是SQL Server 2012的新特性,它提供的工具可以解决数据误差、不一致性和重复等问题。数据管理员和IT人员都可以使用DQS净化数据,保证数据适合他们的BI及其他业务需求。

  DQS环境包含两个组件:数据质量服务器(Data Quality Server)和数据质量客户端(Data Quality Client)。服务器负责执行所有繁重负载。它运行着DQS引擎、存储项目信息和管理知识库。知识库是一个信息或知识的仓库,它可以识别出潜在的错误数据,并且提供一些可能的修正措施。知识库由一个或多个域构成,其中每一个域都包含对应一种特定类型数据的知识。例如,一个域包含的知识可能是确保以相同的方式引用加拿大的所有省份,而且只有正确的省份包含在其中。数据质量客户端提供的接口可以管理DQS、管理知识库和运行将知识应用到数据的质量项目。

0
相关文章