技术开发 频道

SQL Server 2005的数据挖掘功能的非常好的实践

【IT168 案例】作为向用户销售个性化铃声和其它可以被下载到手机的内容提供商,需要时刻和市场保持同步,了解用户需求。ABS-CBN Interactive公司(以下简称为ABSI)是菲律宾最大的综合性媒体和娱乐公司ABS-CBN广播公司的子公司,ABSI公司通过搜索它自己的在线交易(OLTP)数据来向客户提供有价值的交叉销售信息。但是这个搜索需要很多天时间才能够完成,不能够为客户提供个性化建议。ABSI公司希望通过提高系统的响应速度从而在商业活动中占据主动地位,以增加销售额。 通过和微软商务智能金牌合作伙伴 dB Wizards合作,ABSI部署了基于微软SQL Server™ 2000的数据仓库,同时dB Wizards建议ABSi公司使用微软SQL Server 2005.现在已为客户提供精确并且个性化的服务,回应速度提升了一倍,使ASBI能够在商务活动中占领先机。

    一 、商业形势 

    菲律宾手机使用者喜欢使用个性化铃声和一些其它的服务包括无线游戏,阅读名人传记,下载图片信息,参与电视互动和短信息聊天。ABS-CBN Interactive公司(以下简称为ABSI)是菲律宾最大的综合性媒体和娱乐公司ABS-CBN广播公司的子公司,它是这个市场的领先者。 

    每月数百万的使用者,ABSI公司一直充满激情的与用户需求保持一致,提供他们尽可能多的相关体验。为了达到这个目标,ABSI公司通过研究用户的购买模式来预测市场发展趋势和未来的商品供应。 

    根据和无线提供商的协议,ABSI公司可以每周向用户发送许多信息提供新的铃声信息和其它的增值服务,这家公司的最大目标就是通过非常好的的响应速度和最优化的使用它被分配的可用信息数量来向用户提供最具关联性的信息来提高销售额。 

    为了增加铃声的销售额,ABSI公司对在线交易数据(OLTP)数据进行分析以用于研究,预测需要提供的非常好的铃声。在分析过程中,使用SQL语句来对微软SQL Server™ 2000(Microsoft Windows Server System™ integrated server software) OLTP数据进行查询,然后把结果复制到微软EXCEL中进行分析。使用这些系统来产生报表至少需要三天的时间,这就意味着报表永远不可能是最新的,不能够反应当前情况,由于此过程中使用了手工处理,还有可能会产生错误。这个系统可以提供有帮助的信息来为客户提供建议,但是需要使用近一周的时间来完成,然后结果被传播到客户。 

    “在旧的系统中存在很多人为直觉因素,”ABSi公司技术专员Grace Cunanan说, “首先我们察看数据,选择5首歌曲,把这个列表发送给近期订过铃声的人。” 

    ABSI决定使用数据挖掘解决方案来为每个客户定制建议,希望在响应时间上比当前系统有所加强,ABSI需要一个快速并且精确的数据挖掘解决方案。

    二、解决方案 

    通过与dB Wizards公司的合作(微软在菲律宾第一家商务智能方面的金牌合作伙伴),ABSI 部署了基于微软SQL Server 2000的数据仓库和基于微软SQL Server 2005 Beta版的数据挖掘解决方案。“代号为Project 88的解决方案用来为每个用户提供个性化的建议,”dB Wizards公司技术方案经理Poch Reyes说。“我们的建议系统的最初版本主要关注于铃声用户的个人化服务,到目前为止,我们取得了显著的效果,ABSi管理层希望能够在其它的产品服务上也实施此解决方案”。 

    ABSi计划向数据仓库中增加更多信息以支持数据挖掘,第一阶段的架构包括:

 •数据仓库——使用微软SQL Server 2000的数据传输服务(DTS)从处理铃声和其它事务的短信服务器上导出数据至数据仓库。使用50个DTS包,每天都有数百万的事务记录被导入至数据仓库,数据仓库运行在一个独立的SQL Server 2000实例上,数据仓库服务器运行在基于双intel 1 .13G的服务器上,操作系统为Microsoft Windows® 2000 Advanced Server,内存为4G,1 .2T的存储空间。

 •报表—— SQL Server 2000分析服务也运行在数据仓库上。此分析服务中创建了三个多维的数据立方体和一系列虚拟数据立方体,用来处理报表请求,很快就会为SQL Server 2000报表服务(SQL Server 2000 Reporting Services)增加ad hoc报表功能。 


    •数据挖掘——使用从数据仓库导出的数据对微软SQL Server 2005的数据挖掘功能进行测试,ABSi使用了微软SQL Server 2005所带的9种数据挖掘算法中的2种。数据挖掘服务器基于双intel 800M的服务器上,运行微软Windows Server™ 2003, Standard Edition,使用微软Beta版的SQL 


    未来计划向数据仓库中增加数据信息,并为市场和财务创建不同的数据集市。为数据仓库增加更多信息会为数据挖掘提供更多的机会,也会增加在交叉预测时的准确性。ABSi也计划升级数据库存储和数据挖掘的所有服务器至微软SQL Server 2005。 

    将来,当一个用户对一项服务下一订单时Project 88会产生实时的预测建议,举一个铃声例子来说,此系统会为用户建议相关的其它铃声和相关的产品,如可下载的图片等

    四、 优点 

    ABSi公司自从部署了数据仓库和数据挖掘解决方案之后已经得到了许多益处,现在用户可以得到精确并且最新的报表,也可以从数据仓库中得到ad hoc报表,可以在数分种内收集信息而不是以天为单位,这样就可以让他们有更多的时间来研究和决策。微软SQL Server 2005数据挖掘功能帮助这家公司在做交叉销售分析时速度提升一倍。公司还发现自从升级为SQL Server 2005 后,数据挖掘的预测速度提升了8倍,使他们可以向更多的用户发送个性化的建议。 

    1. 响应时间提升一倍 

    把建议系统升级为SQL Server 2005,让ABSi公司的交叉分析响应速度提升一倍。“微软SQL Server 2005数据挖掘可以让我们的响应速度提升一倍,这给我们的管理层留下了深刻的映象,”Cunanan说,“每次我们在管理层会议中展示我们的数据,其他服务的管理者都会要求我们向他们提供同样的奇迹----我们将在完整的项目展示中所作出的成绩。” 

    像响应速度提升一倍一样给人映象深刻的是, Cunanan 认为数据挖掘给出的建议会变的更好。“根据数据挖掘的能力,我相信我们现在看的只是冰山一角,”她说,“当我们对我们的算法进行调整并向数据仓库中导入更多数据时,我们期待看到更大的收获。当我们向数据仓库中增加更多的ABSi数据,比如年龄,其它购买人的音乐流派,以及从相关服务中导出的销售模式数据等,我们应该会得到更加出色的预测。” 

    2. 数分钟出报表而不是天 

    微软SQL Server 2005分析服务非常易于使用,现在花数分钟得到的信息在以前都要使用SQL查询和电子制表软件花上数天才能够产生,这使它更易于探测市场的机会“ 

    “Project 88提供管理管理人员一个平台来及时的分析信息,所以我们可以快速的对市场做出反馈,”Reyes说,“Project 88是管理人员分析数据的一次革命,他们可以和以前完全不同的从不同的角度来分析他们的数据”。 

    3. 数据挖掘模型的处理速度大幅提升8倍 

    ABSi最初使用的是SQL Server 2000的数据挖掘功能,当他们升级为SQL Server 2005时,SQL Server 2005数据挖掘算法的快速学习功能给数据挖掘小组留下了深刻印象。 

    “SQL Server 2005 数据挖掘功能和SQL Server 2000的数据挖掘功能相比,新模型的培训处理更快,”Reyes说。“在SQL Server 2000中我们使用的模型进行培训时需要好几个小时,但是现在使用相同的硬件在SQL Server 2005中只需要数分钟就可以完成,这大量减少的模型培训时间对于我们来说非常重要,这样我们可以服务于其它的产品组和在大量数据集上使用数据挖掘功能”。 

    4. 数据预测更快 

    ABSi公司的数据挖掘小组在看到SQL Server 2005数据挖掘预测的速度和SQL Server 2000数据挖掘预测的速度对比后的结果时非常高兴,“基于我们收集的数据,SQL Server 2005的数据挖掘在处理数据挖掘查询时的速度是SQL Server 2000的64倍,”Cunanan说。“我们需要这样的速度来为我们的客户提供个性化的服务”。 

    这个小组期望查询更加快速。“在实验室中,我们注意到它有非常高的吞吐量,在一台4路,4G内存的计算机上一秒种产生超过了1000个预测建议,”Reyes说,“我们计划在project 88的下个版本中应用SQL Server 2005中的丰富算法,使用它们来认识更多ABSi数据中有意义和有用的关系,未揭露的潜在的机会用于辅助商业决策。SQL Server 2005带领我们的数据挖掘能力到一个新的层次”。

0
相关文章