技术开发 频道

SQL Server 2005数据挖掘与商业智能完全解决方案


【IT168技术文档】
  1.2 商业智能的技术构成
  上一节可以说从多个层面明确了商业智能系统的重要性和必要性,但是,到底如何理解商业智能?商业智能如何实现?本节将解决这些问题。对这些问题的深刻认识是保证在商业智能应用技术实现过程中有一个清晰的思路。

  1.2.1 什么是商业智能
  商业智能的概念最早是Gartner Group于1996年提出来的。当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、联机分析、数据挖掘、数据备份和恢复等部分组成的,以帮助企业决策为目的的技术及其应用。而后随着商务环境的变迁和技术的进步,人们对于BI有了更多和更深的认识,下面将从两个方面探索商业智能的内涵。

  1.不同视角的BI
  BI本身是一个复杂的体系,况且应用环境复杂,这就形成了从不同视角看BI的情况。

  Gartner Group认为:商业智能技术提供使企业迅速分析数据的技术和方法,包括收集、管理和分析数据,将这些数据转化为有用的信息,然后再分发到企业各处,辅助商业决策的制定。

  IDC将BI定义为:商业智能是终端用户查询和报告的工具、OLAP工具、数据挖掘软件、数据集市和数据仓库产品等软件工具的集合。

  IBM认为:商业智能是一系列由系统和技术支持的以简化信息收集和分析的策略集合,它应该包括企业需要收集什么信息、谁需要去访问这些数据、如何把原始数据转化为最终导致战略性决策的智能、客户服务和供应链管理。

  Microsoft认为:商业智能是任何尝试获取、分析企业数据以更清楚地了解市场和客户、改进企业流程和更有效地参与竞争的努力。

  SAP认为:商业智能是一大类收集、存储、分析和访问数据以帮助企业用户更好地进行决策的应用程序与技术。

  SAS认为:商业智能是关于在组织内部和组织周围正在发生的智能或知识。

  MSTR认为:商业智能是一系列能够使公司分析数据库中的数据并根据收集的信息获得的洞察力来作决策的软件系统。

  DWReview认为:从数据分析的观点,商业智能是收集与研究主题相关的、高质量的、有意义的信息、以帮助分析信息、得出结论或做出假设的过程。

  这些观点代表了最典型的BI视角,有一个名为《ttnn BI观点》的电子期刊也对此进行了研究,把这些对BI的认识由虚到实探索其本质,大致分成如下4类。

  1.是努力,MS主张的。

  2.是智能和知识,SAS倡导的。

  3.是过程,DMReview的定义。

  4.是工具和技术集合,Gartner、IDC、IBM、SAP和MSTR代表的。

  任何技术的出现都是为了解决现实中存在的问题。把以上的观点与本章第1节的知识结合起来,应该对商业智能形成以下的认识。

  商业智能是商业数据海洋中的指南针,它从历史数据中提取信息,搞清楚经营状况,通过信息的分析获取对经营决策有价值的知识,从而帮助用户对自身的业务经营做出正确而明智的决定。比如,通过商业智能可以解决客户在不同地域的分布情况,可以对客户进行各个角度的分类,还可以把客户和订单联系起来,找出其变化趋势。

  2.BI中的统计、报表与分析、挖掘
按照智能应用的范围,商业智能系统可以产生客户智能、营销智能、销售智能和财务智能。这些智能的产生包括3个部分的具体功能:信息处理、分析处理和知识发现。前2个部分是商业智能的前端展现对象,第3个部分则属于数据挖掘层次。

  信息处理包括查询和基本的统计分析,如使用交叉表、图表或者图进行报表的展示。分析处理是支持基本的OLAP操作,如上钻、下钻、旋转、切片和切块等,其表现形式也以报表为主。明确了这一点,就能解开大多数BI初学者的疑惑:既然是“智能”的了,为什么还是报表的天下。实际上,统计和报表在很长一段时间内还是BI的重点,但这里的统计和报表与基于数据库的统计和报表有本质的区别,在BI系统中,报表的数据来源不是关系型数据库,而是从许多来自不同的企业运作系统的数据中提取出的有用数据,同时对这些数据进行清理以保证数据的正确性,然后经过抽取、转换和装载(即ETL过程),合并到一个企业级的数据仓库里,再经过联机分析处理(OLAP)而获得的企业数据的一个全局视图。都是报表,BI系统中的报表往往有很强的自定义功能(如可以针对某一个维度随意上钻和下钻)和很强的表现能力(如可以在不同的图形表现形式上随意切换)。

  BI的应用必须基于数据仓库技术,因为数据仓库够大、够清楚、够全面,并且对统计分析需要的数据源支持得够好,这些优点是传统的数据库没有的。笔者所接触到的很多BI与DW的初学者对于商业智能和数据挖掘这两者的关系都存在着认识上的误区,他们要么把它们独立开来,要么把它们等同起来。而实际上,通常讲到BI,更多时候指的是前端应用部分,如现阶段声称是BI提供商的,大多数提供的是前端展现工具;而DW更多时候指的是后端部分,包括架构体系的设计和多维模型的建立等。

  还有一个问题就是数据挖掘(DM,Data Mining),说得学术化一点就是知识发现的问题,这是商业智能过程的第2个层次的应用,通过它可以找出隐藏的模式和关联,进行分类和预测。本书主要描述的是基于数据仓库的商业智能和数据挖掘的技术实现,对其关系的准确认识是学习过程中进行整体把握的基础。对商业智能体系结构的深入探究将有助于达到这一目的。
  1.2.2 商业智能的结构描述
  商业智能的实现包含了“数据→信息→知识→行动→智慧”这一过程所运用的技术和方法。在国外,有人曾经把BI作为一种数据的提纯工厂。BI过程以来自业务系统的数据为基础,经过数据仓库技术的处理,整合数据并将其转化为有序的信息;这些信息经过联机分析处理(OLAP)技术的分析后,可以表达出数据内部的各种关联,这是对商业管理活动有很大帮助的知识;经营活动中很多时候还要进一步明确数据中隐藏的规则,这要靠数据挖掘技术的帮助,最后要采取行动时,可以用模型库和方法库等决策支持的相关技术来辅助决策;而决策和行动的结果又可以作为业务数据反应在业务环境中,为以后的决策提供数据源支持。如此循环往复,商务活动就在BI系统的支持下变得智能了。图1-7表达了这一过程。

  在图1-7中可以发现,商业智能系统是建立在数据仓库、OLAP和数据挖掘等技术的基础之上,通过收集、整理和分析企业内外部的各种数据,加深企业对客户及市场的了解,并使用一定的工具对企业运营状况、客户需求和市场动态等做出合理的评价及预测,为企业管理层提供科学的决策依据。



0
相关文章