3. 在数据生命周期中每一步的洞察力
无论是对商业数据进行使用、分析、监控、计划、探索、或生成报表,预测分析都可以添加丰富的洞察来显示用于发现的新技术。SQL Server 2008是商业智能技术家族的一部分,它们一起使用提供了一个全面的平台,这个平台使得公司可以将预测分析合并到数据生命周期的每一个阶段。
3.1 本地报表集成
报表是大多数公司中的一个基本动作,而SQL Server 2008报表服务提供了一个用于创建、渲染和在整个企业中部署报表的广泛解决方案。SQL Server报表服务通过使用一个数据挖掘扩展(DMX)查询可以直接从一个数据挖掘模型中渲染报表。这使得用户可以显示数据挖掘模型的内容,以用于非常好的的数据显示。此外,直接查询数据挖掘结构的能力使得用户可以超出挖掘模型要求的范围,轻松地将数据包括在内,显示完整和有用的信息。图4显示了用于报表服务的DMX查询编辑器。
图4:用于SQL Server报表服务的DMX查询编辑器
SQL Server 报表服务提供了基于预测可能性生成参数驱动的报表能力。例如,在图4中显示的查询分析了假设的Adventure Works自行车公司预期的客户列表,并使用一个数据挖掘模型来评估这些客户购买一辆自行车的概率。这个查询进行了过滤,只返回购买概率大于50%的预期。图5显示了结果报表,公司可以将它用作是只针对最有可能购买情况的市场策略的基础。它很大程度上改进了策略的有效性,它对投入作出了回馈。
图5:一个预测分析报表
3.2 在数据集成过程中进行数据挖掘
随着商业智能变得越来越普遍,公司越来越多地执行提取、转换和加载(ETL)解决方案将从公司各处而来的数据合并到一个数据仓库中,用于生成报表和进行分析。然而,这些操作的源数据通常是不完整的,或者在某些情况下是商业实体,例如可能需要对客户基于通用描述特征进行分类。
Microsoft SQL Server 2008集成服务提供了一个强大的、可扩展的ETL平台,商业智能解决方案开发人员可以使用它来执行清理和转换数据的ETL操作。SQL Server集成服务包括一个用于培训数据挖掘模型的数据挖掘模型培训目的地,和一个可用于对数据流中传送过来的数据进行预测分析的Data Mining Query转换。预测分析与SQL Server集成服务的集成使得公司可以标记异常数据、分类商业实体、执行文本挖掘、并基于数据挖掘算法的能力和洞察力在空闲时间填入缺失的值。例如,一个ETL过程可能从一个或多个源系统提取客户数据用于放入一个数据仓库中。过去,数据挖掘是在数据仓库加载之后使用的,用于根据预期购买行为分类客户或其它策略管理任务。然而,有了SQL Server集成服务,Data Mining Query转换可以在ETL过程中应用一个数据挖掘模型,使得数据仓库包含了加载过程中分类的数据。这减少了在仓库服务器上所必需做的工作,并确保可用于分析的数据总是最新的,并一直保持是分类的。此外,在ETL过程中的分类还可以用来过滤掉不符合任何已知分类的客户记录。这些记录可能是由于较差的数据质量造成,或显示一个新的、没有在策略管理过程中找到的分类。无论哪种情况,SQL Server集成服务都可以使用数据挖掘发现这些记录并将它们转为手动或自动检查。
图6显示了一个包含了Data Mining Query转换的SQL Server 集成服务数据流。
图6:在SQL Server集成服务中的数据挖掘
3.3 富有洞察力的分析
SQL Server 2008分析服务提供了一个用于多维OLAP分析的高扩展性平台。许多客户已经从在分析服务中创建一个统一的维度模型(UDM)获得了受益,并使用它按多个维度分割商业度量。预测分析是SQL Server 2008分析服务的一部分,它提供了一个更加丰富的OLAP体验,特别是数据挖掘维度按照数据所隐藏的格式将其进行分割。例如,一个销售和市场部门可以创建一个基于现有Customer OLAP维度的数据挖掘结构,并使用它将客户归类到显示相似特征的集群中。然后他们可以使用这个数据挖掘结构来生成一个新的数据挖掘维度,并使用它基于已确认的客户集群来分析销售信息。图7显示了在一个OLAP立方体中的一个数据挖掘维度。
。
图7:在一个OLAP立方体中的一个数据挖掘维度
除了合并数据挖掘结果到OLAP维度中去之外,SQL Server 2008还使得你可以将基于数据挖掘模型的预测功能合并到计算和KPIs 中去。
3.4 预测KPIs
许多公司使用KPIs 来评估对目标的关键商业度量。SQL Server 2008分析服务提供了一个用于企业中KPIs的集中平台,而与Microsoft Office PerformancePoint™ Server 2007的集成使得决策制定者可以建立商业状态面板,用于监控公司的运作。KPIs 一般是用于回顾的,例如显示上个月的销售总数与销售目标相对比。然而,随着通过数据挖掘使得洞察成为可能,公司就可以建立预测KPIs ,它预测未来的执行与目标的比较,为公司提供了一个预先发现和解决潜在问题的机会。图8显示了一个KPI,它显示了预测的未来订单数目。
图8:Microsoft Office PerformancePoint Server 2007
此外,预测分析可以发现影响KPIs的属性。与Office PerformancePoint Server 2007一起,用户可以监控关键影响因素的趋势来识别影响保持不变的属性,例如确定对一个竞争商品进行价格打折是否对销售具有持续的影响,或只是产生一个短期的干预。这样的洞察使得公司可以通告和改进他们的响应策略。