【IT168 技术文档】
Analysis Services 概述
SQL Server 技术文章
作者:Geoff Allix(内容主管)、Julie Strauss
技术审查:Julie Strauss
项目编辑:Joanne Hodgins
出版日期:2007年12月
适用产品:SQL Server 2008
摘要:Microsoft SQL Server 2008 Analysis Services 以投资巨大的Analysis Services 2005所带来的价值为基础,利用了它的可缩放性、高级分析能力以及 Microsoft Office 互操作性。通过在性能、可缩放性以及开发人员工作效率方面的巨大改善,用户可以创建企业规模 Online Analytical Processing(联机分析处理)解决方案。Unified Dimensional Model(统一维度模型)可以合并数据访问,并提供各种分析功能,同时还与 Microsoft Office 和开放式可嵌入体系结构进行深度集成,使您可以利用熟悉的工具接近每位用户,并对企业范围内的用户实现可操作的洞察力。
版权
这是一份预备文档,在本文档中所述软件的最终商业版本发布之前,该文档的内容可能会发生重大变化。
本文档中提供的信息代表了 Microsoft Corporation 当前(软件发布之前)对所讨论问题持有的观点。因为 Microsoft 必须响应不断变化的市场条件,所以其当前的观点不应被解释为是一种承诺,软件发布之后,Microsoft 不能保证现在所提供的所有信息准确无误。
这份白皮书仅供参考。Microsoft 对本文档中提供的信息不做任何担保、明示、暗示或法律方面的承诺。
用户有责任遵守所有适用的版权法。在版权权利限制下,未经 Microsoft 公司明确的书面许可,本文档的任何内容不能被复制、存储或放进检索系统,或者以任何形式或任何手段(电子、机械、复印、录制或其他)或为达到任何目的进行转换。
Microsoft对本文档涵盖的主题内容可能拥有专利、专利申请、商标、版权或其他知识产权。没有来自Microsoft的任何书面许可协议的明确表示,本文档不赋予您对这些专利、商标、版权或其他知识产权的任何许可。
除非另有说明,否则本文档提及的示例公司、组织、产品、域名、电子邮件地址、徽标、人物、地点和事件皆属虚构,与任何真实的公司、组织、产品、域名、电子邮件地址、徽标、个人、地点或事件无关。
Ó 2007 Microsoft Corporation。保留所有权利。
Microsoft、Excel、Word、Visio、Office、PerformancePoint、SharePoint、PivotChart、PivotTable、SQL Server 和 Visual Studio 是 Microsoft Corporation 在美国和/或其他国家/地区的商标或注册商标。
本文档中提及的真实的公司和产品名称可能是其各自所有者的商标。
目录
简介 1
创建企业规模解决方案 1
开发人员的高工作效率 1
可缩放的基础结构 3
卓越的性能 3
通过全面分析扩展解决方案 3
统一维度模型 4
关键企业度量的集中管理 4
预测分析 4
Microsoft SQL Server Data Mining Add-Ins for Office 2007 4
通过熟悉的工具实现可操作的洞察力 5
优化的 Office 互操作性 5
Microsoft Office Excel 5
Microsoft Office Word 6
Microsoft Office Visio 6
Microsoft Office SharePoint Server. 6
Microsoft Office PerformancePoint Server. 7
丰富的合作伙伴扩展 7
开放的可嵌入式体系结构 7
结束语 7
简介
分析解决方案正在迅速成为许多企业的关键任务。这导致这些系统中存储的数据量出现爆炸式增长,这就需要更大、更快的解决方案能够快速、有效地被创建和开发出来以提供支持。
Microsoft SQL Server 2008 Analysis Services 的设计目的是要提供出色的性能和巨大的规模,以支持带有数百万条记录和数千名用户的应用程序。创新的合并工具有助于提高开发人员的工作效率,并能带来更优的设计和更快的实施速度。
开发人员的高工作效率
开发人员要创建和部署解决方案,一般都需要学习和使用多种工具。不过有了 Analysis Services 之后,在整个开发周期中,从项目开始到开发和部署,开发人员都可使用 SQL Server Business Intelligence Development Studio(BIDS)。由于 Business Intelligence Development Studio 以 Visual Studio 开发环境为基础,因此它可与 Visual Studio Team System 实现完全集成,从而提供设计、开发、协作、优化和测试资源。在它提供的集成式直观环境中,开发人员的工作更快且更有效率。而且,为进一步提高工作效率,BIDS 还提供了复杂的 Business Intelligence Wizards(商业智能向导)。一套使用简单的向导可帮助大多数新用户
对商业智能问题进行建模,这使得大量人员和组织能够更方便地参与 BI 项目的开发。
早期开发阶段的设计效率低下往往会浪费大量开发时间,因为开发人员已经完成的工作是以不正确的设计为基础的,因此在修正错误后,需要重新设计。SQL Server 2008 Analysis Services 新引进了一套创新的 Best Practice Design Alerts(非常好的实践设计警报),可在开发流程的早期阶段对潜在的设计问题自动发出通知,这会减少由于设计错误导致的时间浪费,并有利于实施更快的开发流程。图1显示了针对 Time 维度和 Calendar 层次结构的警报。在图1中可以看到,警报突出显示了问题区域,但它们不会以任何方式影响功能,可以简单地忽略或关闭单个或全部警报。
除了看到的实时警报以外,也可以浏览解决方案设计来查看所有警报。图2显示了某项设计目前提供的警报。
SQL Server 2008 Analysis Services 利用新的、改进的多维数据集、维度和属性设计器,进一步提高了开发人员的工作效率。图3显示了新设计的“Attribute Relationships(属性关系)”设计器。
可缩放的基础结构
Analysis Services 可以进行缩放,以支持许多规模达到兆兆字节并且服务于数千名用户的数据库。为支持许多用户、避免竞争及降低成本,可以缩小 Analysis Services 解决方案的规模,而缩小 Analysis Services 解决方案的规模一般需要增加处理和存储开销,以存储和同步几个版本的数据,但 SQL Server 2008 Analysis Services 可以在若干 Analysis Services 服务器之间共享一个只读的 Analysis Services 数据库,从而完全避免此类开销。
当系统的大小和用户数目增加时,对实时资源的监视变得极为重要。SQL Server 2008 Analysis Services 提供了与数据库引擎所用的类似的 Dynamic Management Views(动态管理视图)。这些特性提供了实时的企业系统信息,用于监视、分析和进行性能调整。
当数据库大小增加时,维护备份所需的时间和成本会相应增加。在处理 OLAP 数据库时,一旦数据库的大小达到一定规模,备份时间往往会按指数增长,但有了 SQL Server 2008 Analysis Services 之后,新的备份存储子系统会使备份时间随着数据库大小的增加按线性增长。这将消除备份大小的限制,因此也会消除数据库大小的限制。
当数据库变得更大时,可能会更难找到用户需要的信息。“透视”功能提供了覆盖数据市场所有优势的UDM筛选视图,消除了多余的存储、降低了处理成本、无需在数据市场之间执行同步,并消除了由于存储同一数据多个副本所导致的数据一致性和完整性问题。
随着全球化进程的日益发展,解决方案需要展示给全世界的客户。对于世界上的所有客户而言,数据一般都是相同的,但按照各种语言的要求,多维数据集、度量值、维度名称和级别、关键性能指标(KPI)等元数据均不相同。通过翻译可创建各种语言的不同元数据值,而且可对解决方案进行全局缩放。财务信息也需要进行本地化,要以适当的货币表示结果。Analysis Services提供强大的翻译功能和自动货币转换功能,能够以用户所用的语言本地化分析数据。
卓越的性能
Analysis Services 多维数据集是一种多维结构,可以快速访问大量的预聚合数据,使终端用户能够以思维的速度,洞察相关的业务数据。Analysis Services 以一种高度优化及压缩的格式存储其数据,此格式称为“Multidimensional OLAP(多维 OLAP,简写为MOLAP)”。它还能以 Relational OLAP(ROLAP)格式将数据(部分或全部)存储到关系数据库中,或以 Hybrid OLAP(HOLA)混合格式存储数据。MOLAP 的性能远远超过 ROLAP 和 HOLAP。
多维数据很少见,这是由其本质决定的。例如,您不会每天都在某个零售商的每家店里购买每种产品。SQL Server 与大多数 OLAP 系统不同,它不存储这些 NULL 值,因此数据库会显著缩小,从而避免了造成数据爆炸,也提高了性能。许多 OLAP 系统浪费大量查询处理时间将单元格中的数据与 NULL 值进行聚合,随之产生了 NULL 值。SQL Server 2008 Analysis Services 使用了一种称为“Block Computation(分块计算)”的技术,它利用了多维数据集的稀缺性,仅处理非 NULL 数据,以提高查询效率。这能够极大地提高查询效率,因此可以更细的粒度进行分析。
SQL Server 表现出卓越性能的另一个领域就是基于属性的层次结构。数据库通常都包含共享公共属性的层次结构。在大多数 OLAP 系统中,必须为各个层次结构都复制这些公共属性,但SQL Server 提供了基于属性的层次结构,无需进行任何复制,因而提高了性能和可缩放性。
“Writeback(写回)”是 Analysis Services 中的核心功能,使用户能够修改单元格的值。它常用于规划、预算和预测应用程序。Analysis Services 的旧版本要求以 ROLAP 格式存储写回数据。SQL Server 2008 Analysis Services 允许以 MOLAP 格式存储写回数据,因此能够显著提高查询和写回操作的效率。
主动缓存为 MOLAP 性能增添了实时分析特性。这是通过保持数据的最新副本而实现的,而且这些数据以 UDM 结构为基础,是专为高速访问而组织的。通过提供高性能、透明且同步的聚合缓存,避免用户使关系数据库负载过大。
通过全面分析扩展解决方案
大多数人认为OLAP是存储和聚合引擎。这种想法也适用于 Analysis Services。但是,Analysis Services 将此分析平台提高到了新层次,与传统的 OLAP平台相比,它提供了更多高级特性。这使组织能够利用一种解决方案满足多种分析需求,因为该解决方案提供的特性要比传统的 OLAP 平台多得多。在这方面,Unified Dimensional Model(统一维度模型)扮演了核心角色,它提供了丰富的分析功能。
统一维度模型
UDM 对于 Analysis Services 而言是一个新概念,它最早是随着 SQL Server 2005 的发布而出现的。它在用作数据源和专有多维数据集的物理关系数据库与用于满足用户查询的维度结构之间提供了中间逻辑层。通过这种方式,可将 UDM 当作 OLAP 解决方案的核心部分。但如前所述,UDM 的概念会影响到 Analysis Services 解决方案的多个方面。UDM 的关键优势之一是,能够结合传统关系报告模型的灵活性、丰富性与经典 OLAP 模型的强大分析能力和卓越性能。此外,该模型还提供丰富的高级商业智能功能,以提供最优的关系分析和 OLAP 分析,并进一步使组织能够利用独特的Key Performance Indicator Framework (关键性能指标框架)以及复杂的预测分析功能,轻松地扩展解决方案,而这些功能都是通过UDM提供的。
关键企业度量的集中管理
在 SQL Server 2008 Analysis Services 中,企业范围的“关键性能指标(KPI)”可被集中存储和管理。这为用户通过各种应用程序访问关键企业度量提供了一个集中的存储库,这些应用程序包括 Microsoft Office PerformancePoint Server 2007、Microsoft Office Excel 2007、Microsoft Office SharePoint Services 2007 和 Microsoft SQL Server Reporting Services。
预测分析
传统的数据分析是处理历史数据,并根据这些数据快速返回结果。但是,商业用户询问的许多问题无法通过此类分析得到解决,因为他们并非要寻找已经发生的结果,而是要预测可能发生的情况。能够预测未来趋势是任何组织取得成功的最重要因素之一,但这并不只是像延长趋势线那样简单。需要将成员分组以创建具有类似行为的群集,需要评估影响因素以度量它们对特定结果产生的作用,还需要识别相互依赖性。
Analysis Services 中的数据挖掘算法提供了这种预测分析能力,而 SQL Server 2008 Analysis Services 改善了数据挖掘算法,可以实现更全面的分析。
Microsoft SQL Server Data Mining Add-Ins for Office 2007
Microsoft SQL Server Data Mining Add-Ins for Office 2007 是一组易于使用的数据挖掘功能,使用户能够通过 Office 2007 访问数据挖掘功能,这样就能在每台台式机上进行预测分析。由于能够在熟悉的 Office 环境中利用 Microsoft SQL Server 2008 Analysis Services 极为复杂的数据挖掘算法,因此商业用户只需单击几次鼠标,即可轻松地获得对复杂数据集的宝贵洞察力。由于在设计时已考虑到终端用户,因此 Data Mining Add-Ins for Office 2007 使终端用户能够直接在 Microsoft Excel 和 Microsoft Visio 中执行高级分析。
包含三个独立的组件:
Data Mining Client for Excel 使用户能够在 Excel 2007 中创建及管理整个 Analysis Services 数据挖掘项目。
Table Analysis Tools for Excel 使用户能够利用强大的 Analysis Services 数据挖掘功能分析Excel 电子表格中存储的数据。
Data Mining Templates for Visio 使用户能够在 Visio 图表中呈现决策树、回归树、分类关系图和依赖关系网络。
通过熟悉的工具实现可操作的洞察力
如果不能使所有用户都能轻松地访问信息,那么强大的分析解决方案就没有任何业务收益可言。SQL Server 2008 Analysis Services 不仅能够服务于业务用户,还能利用 Microsoft Office 中的熟悉工具为组织中的每个人都提供分析信息。可以利用SQL Server 2008 Analysis Services 的开放体系结构开发客户界面,而开发人员也可利用该产品的可扩展性扩展其功能。
优化的 Office 互操作性
2007 Microsoft Office 系统提供与 SQL Server 2008 Analysis Services 的优化的互操作性。通过熟悉的工具将信息显示在桌面上,可以扩展分析信息的显示范围。例如,Excel 2007 是一种功能完整的 Analysis Services 富客户端,而 Microsoft Office PerformancePoint Server 2007 Analytics 提供了 Analysis Services 瘦客户端。下列的 2007 Office 系统组件提供了 Analysis
Services 互操作性:
Microsoft Office Excel
Excel 2007 是一种功能全面的 Analysis Services 客户端。Excel 2007 提供了如下功能:
Excel 能够访问在 Analysis Services OLAP 多维数据集中存储的数据。Excel 提供了透视表,可向用户展示多维数据,并使用户能够对数据进行切片和划分。服务器执行处理,结果将被缓存到服务器和客户端上,以增强性能。
Excel 为用户提供 Analysis Services 特性和分析功能,如 KPI、计算成员、命名集、操作和翻译。
Excel 可以利用 Data Mining Add-Ins for Office 2007 为终端用户提供丰富的预测和统计分析功能。
Excel 能够增加自动分析功能,如突出显示数据与表中其他区域或数据范围中的模式不同等异常、根据当前趋势预测未来值、分析不同应用场景的可能结果,以及确定修改的内容以适应特定目标。
Reporting Services 可利用 Analysis Services 数据创建报告,并将其呈现为 Excel 电子表格,以提高其对终端用户的可用性。
Microsoft Office Word
Reporting Services 可利用 Analysis Services 数据创建报告,并将其呈现为 Microsoft Office Word 文档,以提高其对终端用户的可用性。之后,这些报告可以直接在 Microsoft Office Word 中编辑。
Microsoft Office Visio
Toy 可以利用 Microsoft Office Visio 注释、强化及表现数据挖掘图表视图。利用 SQL Server 2008 和 Visio 2007 可以执行如下操作:
呈现决策树、回归树、分类关系图和依赖关系网络。
将数据挖掘模型保存为可嵌入其他 Office 文档中的 Visio 文档,也可将其保存为网页。
Microsoft Office SharePoint Server 2007
这是一种全面的协作、发布和面板解决方案,可以此为核心提供保存企业范围所有 Analysis Services 数据的集中位置,这样组织内的任何人都可以查看相关的、及时的分析视图、报告和 KPI,并能够与之交互。
Microsoft Office PerformancePoint Server 2007.
这是一种集成式性能管理应用程序,职员可根据SQL Server 2008 Analysis Server 2008 Analysis Services 提供的数据利用该程序监视、分析和规划业务活动。Office PerformancePoint Server 2007 提供了记分卡、面板、管理报告、分析、规划、预算、预测和合并功能,以实现广泛的性能管理能力。
丰富的合作伙伴扩展
SQL Server 2008 提供了开放式体系结构,使开发人员能够以 Analysis Services 为基础创建解决方案,并扩展其功能。Analysis Services 提供存储过程,可通过外部编程语言直接访问 Analysis Services 功能。存储过程提供了跨语言的异常处理、版本控制和部署支持。
数据挖掘代表了任何形式的统计分析,由于该领域正处于发展之中,因此新的数据挖掘算法可能使分析系统变得过时。Analysis Services 支持插件算法以扩展数据挖掘功能,并可添加由第三方或内部开发人员提供的新数据挖掘算法。
开放的可嵌入式体系结构
许多组织都需要定制的客户界面,或者需要在其他服务和应用程序中使用 Analysis Services 数据。
长期以来,Analysis Services 一直支持 OLE DB for OLAP、ADOMD 和 ADOMD.Net,但现在增加了对 SQL Server 2008 Analysis Services 的支持,以利用 XML for Analysis(XML/A)标准揭示数据。现在,每台 Analysis Services 服务器都是 web 服务的提供程序,这样可将分析数据直接集成到现代的应用程序中。
结束语
Microsoft SQL Server 2008 Analysis Services 作为分析工具的坚实基础,提供了真正企业规模的解决方案。性能和可缩放性均已得到极大改善,并且处理速度更快、大数据库备份操作更优化且增添了新的监视功能。通过将数据市场与 UDM 相结合,并将关键企业度量的访问和管理集中到一起,使用户可以更方便地使用数据。分析功能方面增加了可增强数据挖掘工具集的预测功能。
仅仅访问数据还不足以使这些信息与业务发生联系。用户需要使用熟悉的工具,应用程序开发人员需要能够将数据集成到他们的应用程序中。Analysis Services 提供了优化的 Office 互操作能力,以及熟悉的界面和开放的可嵌入式体系结构,使开发人员能够集成数据。
获取更多信息:
http://www.microsoft.com/sql
本文对您有帮助吗?请告诉我们您的感受。如果从1(差)到5(极好)的分值中进行选择,您认为本文应该打几分?原因是什么?例如:
您是否认为由于提供了很好的例子、精美的屏幕截图、清晰的文字描述或其他原因而应该给它高分?
您是否认为由于用例不当、屏幕截图模糊、文字描述含混不清而应该给它低分?
您的意见有助于我们改善所发布白皮书的质量。提交意见。