技术开发 频道

SQL Server 2012的五个商业智能特性

  【IT168 评论】SQL Server 2012交付了一些新特性,增强和扩展了的功能远胜于SQL Server 2008和2008 R2。这一点在商业智能(BI)领域特别明显,因为BI领域在报表和分析功能方面的改进比以往任何时候都要多。组织如果要改进其BI,需要特别注意以下五个SQL Server 2012商业智能特性。

  BI语义模型

  SQL Server 2012引入了BI语义模型(BI Semantic Model, BISM),它给支持的分析和报表平台提供了一个用于交付BI的概念框架。虽然BISM本身并不是一个物理实体,但是它提供了在SQL Server Analysis Services (SSAS)和PowerPivot for Excel中创建物理模型的结构。在SSAS中,我们可以创建两种BISM模型:多维模型和表格模型。在PowerPivot for Excel中,我们只能创建表格模型。

  多维模型通常情况下都是业务模型。它与早期的SSAS版本的统一多维模型(Unified Dimensional Model, UDF)保持一致,将数据组织为库、维度和层组。与UDF类似的是,多维模型使用多维表达式(Multidimensional Expressions, MDX)语言访问多维数据存储,提供了一个执行复杂分析操作的强大环境。

  SQL Server 2012的BISM实际上是表格模型,与多维模型不同,它将数据组织为包含行与列的表格,这与关系数据库很像。此外,表格模型使用数据分析表达式(Data Analysis Expressions, DAX)语言访问数据,它可以查询各种数据源,其中包括关系数据库、SSAS库、文本文件和PowerPivot工作薄。表格模型是在SQL Server 2008 R2的PowerPivot for Excel和PowerPivot for SharePoint版本中引入的。这个模型使用xVelocity引擎(前身是VertiPaq引擎)将数据缓存在内存中,同时使用非常先进的压缩和扫描算法支持高性能分析。

  字段存储索引

  xVelocity技术,即非聚簇字段存储索引是我们要介绍的第二个SQL Server 2012商业智能特性。与常规非聚簇索引类似,字段存储索引定义在一个或多个表字段上。与非聚簇索引不同,这些数据保存为字段型格式。换言之,每一个索引字段的数据都存储在索引中属于自己的字段里。如果一个表的记录行超过百万,那么索引会被分割为片段,但是字段型结构将会保留。另一方面,非聚簇索引以记录行的方式存储数据。

  除了字段型存储,字段存储索引还使用xVelocity的高级存储和压缩功能。这些特性加在一起可以显著提升那些必须检索和处理大数据集的查询,这种查询通常发生在数据仓库中,而其中的数据通常都经过分组、过滤、汇总并跨越多个表。它通常可以大大提升性能,因为只有适用的字段才能够加载到内存中,而加载到内存的数据又经过高效压缩,而且针对这些数据的查询还专门对分析操作进行了优化。

  数据质量服务

  只有正确的数据,才能支持高效的挖掘、分析、报表和仓储。但是,从多个应用了不同标准的系统查询数据通常会产生错误、混乱和不一致性。这时就是数据质量服务(Data Quality Service, DQS)发挥作用的时候。DQS是SQL Server 2012的新特性,它提供的工具可以解决数据误差、不一致性和重复等问题。数据管理员和IT人员都可以使用DQS净化数据,保证数据适合他们的BI及其他业务需求。

  DQS环境包含两个组件:数据质量服务器(Data Quality Server)和数据质量客户端(Data Quality Client)。服务器负责执行所有繁重负载。它运行着DQS引擎、存储项目信息和管理知识库。知识库是一个信息或知识的仓库,它可以识别出潜在的错误数据,并且提供一些可能的修正措施。知识库由一个或多个域构成,其中每一个域都包含对应一种特定类型数据的知识。例如,一个域包含的知识可能是确保以相同的方式引用加拿大的所有省份,而且只有正确的省份包含在其中。数据质量客户端提供的接口可以管理DQS、管理知识库和运行将知识应用到数据的质量项目。

  强力视图

  SQL Server 2012的另一个新增BI特性是强力视图(Power View),它是SharePoint服务器的一个SQL Server报表服务(SSRS)插件。强力视图基于Silverlight应用框架,给最终用户提供了基于Web的数据查询工具,而且它还可以创建具有丰富数据可视化功能的点对点报表。创建一个强力视图报表就像在Microsoft Excel中创建一个数据透视表或数据透视图一样简单。与实用SQL Server Data Tools的Report Builder和Report Designer不同的是,用户总是能够看到最新的数据,而不需要在各个视图之间来回切换。

  用户可以在一个配置了SSRS插件的SharePoint网站启动强力视图。所以,必须安装SharePoint服务器和SQL Server。此外,开发者或管理员必须至少创建一个数据模型。这个数据模型将作为报表与数据源之间的接口,使用户能够轻松访问所需要的数据,而完全不需要理解底层数据结构。在创建报表时,用户只需要登录到SharePoint网站(通过支持Silverlight的浏览器),找到文档库或PowerPivot库的可用数据模型,然后用这个模型启动强力视图。然后,他们可以通过简单拖放操作来创建自己的报表。

  语义搜索

  SQL Server基于结构化关系数据,但是与以往不同的是,现在BI在它的分析与报表操作中加入了非结构化数据。SQL Server适应非结构化数据流入的唯一方法是提供全文搜索功能,并且它是数据库内置的功能。全文搜索允许我们针对字符型字段的数据执行单词检索,其中包括指向非结构化数据文件的FileStream字段。然而,SQL Server 2012则更进一步,引入了语义搜索(Semantic Search),这个特性扩展了全文搜索,从而能够提取和索引非结构化文档中在统计上相关联的关键词汇。

  语义搜索比全文搜索更进一步,它关注于文档的含义,而不仅仅是文档内的单词。这样就促成了另一些特性,如自动提取标记、发现相关内容和在相似内容上实现层次导航。这样的话,语义搜索就可以帮助用户发现与所搜索文档相似或相关的文档。

  SQL Server 2012引入的另一个新特性使语义搜索变得更加强大:FileTable。FileTable是一种扩展FileStream功能的表,其目的是支持Win32应用编程接口(API)。每一行记录都代表一个文件或目录,Windows应用程序可以直接访问这些记录。从应用程序角度看,这些文件和目录就像存储在文件系统中,而不是存储在数据库。如果和FileTable一起使用,语义搜索就变成一种支持非结构化和关联信息挖掘等应用程序的重要工具。

  SQL Server 2012 BI

  这里要介绍的5个SQL Server商业智能特性可能是在实现BI平台过程中最非常宝贵的工具。然而,我们所介绍的只是一些已经更新或添加到SQL Server 2012的BI特性。例如,SSAS包含了新的DAX功能,并且已经改进了多维数据库的资源使用报表功能。SSIS也增加了DQS净化转换功能,改进了Merge和Merge Join转换的内存使用效率。SQL Server SSRS已经重新设计了它的SharePoint集成方式,以便更好地使用许多SharePoint IT特性。如果您需要转到SQL Server 2012,那么您一定会在BI实现中使用这些特性。

  TechTarget原文链接:http://www.searchdatabase.com.cn/showcontent_80440.htm

  更多精彩尽在2014年4月10日-12日在北京五洲皇冠国际酒店举办的第五届中国数据库技术大会,3月25日之前订票可享受8.8折最低票价。

Facebook专家:Hadoop不足以处理大数据
进入官网了解更多详情

0
相关文章