技术开发 频道

双菱空调实施博科资讯BI案例

    在用友、金蝶相继代理商业智能软件海博龙(Hyperion)和Brio之后,与用友、金蝶同为中国管理软件前三强的上海博科,研制成功了我国第一套商业智能软件博科财务智能仓(BI-FIW),并进行了大规模的市场推广。商业智能继ERP/ERPII之后,我国管理软件市场的又一个应用新热点。

  IDC将商业智能解决方案定义为帮助企业跟踪、分析、模拟和预测他们自己的业务过程以及他们的客户、供应商和合作伙伴关系的解决方案。并指出:在五年之内,商业智能市场规模将从现在的55亿美元扩大到157亿美元。硅谷动力网早在2001年对103家企业的CIO所做的调查数据就显示,在未来两年里,CIO们最优先考虑实施的信息化项目,排在首位的是商业智能(37.2%),位列信息存储和灾难恢复系统(33.5%)、客户关系管理(29.8%)和网络安全系统(28.7%)之前。面对如此巨大的商业智能市场,介入的技术壁垒到底有多高?各商业智能软件采用哪些IT技术?本文结合上海双菱空调商业智能的应用,通过分析商业智能的三大核心技术:数据仓库、联机分析处理、数据挖掘,对商业智能软件进行了技术方面的剖析。

  上海双菱空调器制造有限公司是一家中日合资企业,位于上海市浦东工业综合开发区,建有设施先进的现代化厂房,年生产能力超过300万台,产品包括双菱定速、变频、民用商用空调系列,款式包括窗式、分体挂壁式、落地式、嵌入式、吊顶式及小型家用中央空调。上海双菱是空调行业的知名企业,在全国二十几个省市设有商务代表处,20%以上产品出口欧洲的意大利、西班牙、希腊、东南亚的印尼、印度、新加坡、东欧、中东及北美洲等几十个国家和地区。

  上海双菱空调一直比较重视企业信息化建设,但由于其分子公司较多,经营水平参差不齐,信息化需求各不一样,因此信息化应用系统欠缺统一性。目前,双菱空调已经实施信息化的业务领域包括企业财务管理、企业内部物流管理,使用的软件品牌包括博科、用友、金蝶。上海双菱空调为了解决企业信息化数据相对分散,信息化数据利用率不高的问题,开始着手选择商业智能软件。2003年作为第一批使用国产化商业智能软件的用户,上海双菱与博科资讯合作,开始了商业智能的应用之路,商业智能的三大核心技术在上海双菱都得到充分应用。

  数据仓库(DW)

  上海双菱在实施博科商业智能——财务智能仓(BI-FIW))之初,已经有了许多的业务数据,但这样数据都没有得到有效利用。例如客户交易资料,管理人员无法从这些数据中分析出客户的效益和商业行为特征。面对一份个别客户的详细档案,何时采用何种方式才能满足该客户的需求?这是令管理人员非常苦恼的事情。当然,客户数据的分析确实不是一件容易的事情:如果收集了1000个客户的信息,每个客户100条交易数据,然后必须存储、管理和分析100,000个具体数据。即使是一件很小的分析工作,需要处理的数据之多也令人生畏。数据的集中存储,成为上海双菱使用商业智能的最初原因。

  数据仓库的建立是为了满足决策支持的需要,而更好地组织企业内所有可能收集到的数据。建立数据仓库不是目的,只是进行决策支持的中间环节,保证数据的一致性、准确性、综合性、易用性,为各种决策支持方案提供统一的数据源。例如以客户为中心的数据仓库是根据客户管理的需求,对企业所有可能和客户相关的数据进行重组,使得企业对自己的客户具有统一的认识。上海双菱建立的数据仓库,包含以下几个要素:ETL(数据的抽取、转换和装载);数据仓库的存储;数据仓库的管理和维护(包含元数据的管理)。  

    联机分析处理(OLAP)上海双菱空调采用了博科自主的OLAP技术,用于对集中存储的管理数据进行多维多点的即时分析。OLAP是联机分析处理的英文缩写,是一种用于对大容量数据归总与分析的技术,它使用户能够以更快、更易于使用的交互方式从数据中获得信息。OLAP的关键是能够以用户想得到的方式来表示数据,主要通过多维的方式来对数据进行分析、查询和报表,它不同于传统的OLTP应用。OLTP应用主要是用来完成用户的事务处理,通常要进行大量的更新操作,同时对响应时间要求比较高。而OLAP应用主要是对用户当前及历史数据进行分析,辅助领导决策。其典型的应用有对银行信用卡风险的分析与预测、公司市场营销策略的制定等。主要是进行大量的查询操作,对时间的要求不太严格。

  目前,常见的OLAP主要有基于多维数据库的MOLAP及基于关系数据库的ROLAP。在数据仓库应用中,联机分析处理应用一般是数据仓库应用的前端工具,同时,联机分析处理工具还可以同数据挖掘工具、统计分析工具配合使用,增强决策分析功能。

  此外,OLAP的一个重要特点是多维数据分析,这与数据仓库的多维数据组织正好形成相互结合、相互补充的关系。OLAP技术中比较典型的应用是对多维数据的切片和切块、钻取、旋转等,它便于使用者从不同角度提取有关数据,OLAP技术还能够利用分析过程对数据进行深入分析和加工。

  OLAP主要的应用技术是“旋转和切片”、“数据挖掘”。

  ——旋转和切片。OLAP让最终用户能够对整理过的信息进行切片和旋转操作,以便从不同角度考察数据。用户可以沿着任一轴“切割”或“转动”一片特定的继承数据。

  ◆切片和切块通过切片、切块功能,用户可以对数据进行过滤,专注于某一方面的问题,例如,用户通过拖拽的方式很容易的得到诸如“华东地区2003年的销售情况”这样的数据。

  ◆钻取钻取包含向下钻取和向上钻取操作,钻取的深度与维所划分的层次相对应。向下钻取是通过对某一行汇总数据进行细分来分析数据。例如,用户分析“各地区、城市的销售情况”时,可以对某一个城市的销售额细分为各个年度的销售额,对某一年度的销售额,可以继续细分为各个季度的销售额。通过钻取的功能,使用户对数据能更深入了解,更容易发现问题,做出正确的决策。向上钻取是指自动生成汇总行的分析方法。通过向导的方式,用户可以定义分析因素的汇总行,例如对于各地区各年度的销售情况,可以生成地区与年度的合计行,也可以生成地区或者年度的合计行。

  ◆旋转为了方便用户更直观的查看分析数据,博科财务智能仓支持数据的旋转功能,从不同的视角来查看数据,对于一些数据,通过旋转功能,看起来可以更加直观,例如时间序列分析中,各地区各年度的增长量情况,把年份作为旋转维度,则同一地区不同年度的数据以及增长量将在一行显示,看起来更容易理解。

  ——数据挖掘。数据挖掘是按照既定的业务目标,对大量的企业数据进行探索、揭示隐藏其中的规律并进一步将之模型化了的先进、有效的方法。OLAP允许用户使用“数据挖掘”或导航技术获取更详细的信息。数据导航能帮助最终用户回答“为什么”的问题,大多数OLAP工具都可以使用户在一个数据集内向下挖掘到最深层次的细节,而大多完整的工具允许用户“挖掘到任何地方”,除“向下挖掘”外,还可“向上挖掘”,甚至可以“跨越挖掘”,即在同一层次上从一个数据集水平地移到另一套数据上。例如,使用者可以按照季度、商店类型、洲三个维度来展现数据,并对每一项提供了“实际消费”、“平均实际消费”、“该项消费占该类消费的百分比”、“实际收益”、“平均实际收益”以及“该项数据占该类收益的百分比”的比较数据。这样可以使消费和收益的数据更为直观地进行横向的和纵向的比较。 

  财务智能仓在上海双菱空调的OLAP应用示意图

   数据挖掘(DM)

  数据挖掘,也可以称为数据库中的知识发现(KDD,Knowledge Discovery in Database),是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程。数据挖掘是一种决策支持过程,它从大量的数据中提取隐含的、潜在的、以前未知的有用信息或模式。它主要基于人工智能、机器学习、统计学、数据库等技术,通过分析大量的原始的数据,作出归纳性的推理,挖掘出潜在的模式并预测客户的行为,帮助企业的决策者调整市场策略,减少风险,做出正确决策。

  上海双菱空调使用数据挖掘技术,是希望按照企业既定的业务目标,对大量的企业数据进行探索、揭示隐藏其中的规律性并进一步将之模型化的先进、有效的方法。如通过对客户各种数据深入分析,了解客户的行为,建立模型,并对客户未来的行为进行预测。多年来,上海双菱的统计人员采用手工方式“挖掘”数据库,寻找统计学上的重要模式。现在,数据挖掘技术被很好地用于为上海双菱空调预测客户行为进行建模。预测建模可以对客户进行分类,同时对客户的行为进行打分,这些信息可以被整合到数据仓库和其他市场营销应用中。

  上海双菱空调采用的数据挖掘分析方法主要有:关联分析、序列模式分析、分类分析和聚类分析等。数据挖掘利用人工智能领域中一些已经成熟的算法和技术如:人工神经网络、遗传算法、决策树方法、邻近搜索算法、规则推理、模糊逻辑、公式发现等来进行数据的挖掘。数据挖掘是人工智能中的成熟技术在决策支持系统中的具体应用。

  OLAP和数据挖掘是相辅相成的,但它们的侧重点不同,OLAP侧重于与用户的交互、快速的响应速度及提供数据的多维视图而数据挖掘则能自动发现隐藏在数据中的模式和有用信息。OLAP的分析结果可以给数据挖掘提供分析信息作为挖掘的依据,数据挖掘可以拓展OLAP分析的深度,可以发现OLAP所不能发现的更为复杂、细致的信息。从上面的论述可以看出如果将OLAP与数据挖掘相结合将会发挥更好的效用,这是OLAP发展的又一个新方向。

  数据挖掘是当前业界的热门技术,已经在多个应用领域产生了巨大的效益。数据挖掘不一定需要建立在数据仓库的基础上,但是,如果将数据挖掘和数据仓库协同工作,则可以简化数据挖掘过程的某些步骤,从而大大提高数据挖掘的工作效率。并且,因为数据仓库的数据来源于整个企业,保证了数据挖掘中数据来源于整个企业,保证了数据挖掘中数据来源的广泛性和完整性,例如,上海双菱的信息化数据包括了财务及物流业务的管理领域,数据来源包括了博科、用友、金蝶的软件系统,以及自主开发的软件系统。

  数据挖掘技术是数据仓库中应用比较重要也是相对独立的部分,目前正处在发展不断当中。数据挖掘涉及到数理统计、模糊理论、神经网络和人工智能等多种技术,技术含量比较高,实现难度较大。此外,上海双菱还考虑在以后将数据挖掘技术与可视化技术、地理信息系统、统计分析系统相结合,丰富数据挖掘技术及工具的功能与性能。

0
相关文章