3.2数据挖掘技术
数据挖掘并不是一项全新的技术,它的出现与发展有着其自身的必然性。用户不仅需要一般的查询和报表工具,更需要从多种相关联的数据中提取高质量的信息。一个数据挖掘处理系统不是多项技术的简单组合,而是一个完整的整体。
数据挖掘模型工作涉及了非常广阔的技术领域,当系统对应采用的技术有了明确的方向,系统的数据结构和内容也有了充分的适应性,采用合适的技术手段如数理统计方法、人工神经元网络、决策树等,就能很好的解决问题。数理统计方法是数据挖掘工作中最常用的主流技术手段,它可进行各种不同类型模型、不同特点数据的分析,并能产生各种有用的统计量和诊断信息。在多变量统计分析方面,它能提供主成分分析、典型相关分析、判别分析和因子分析等。数理统计工具不仅能揭示已有数据间的新关系、隐藏着的规律性,而且能反过来预测它的发展趋势,或是在一定条件下将会出现什么结果。数据挖掘工具应用于缺陷管理中,必须根据实际情况采用合适的算法:
关联分析:关联分析用于挖掘出数据间的相互关系,找出它们间的相关度。
序列分析:序列模式分析用于挖掘出同一类数据间的相互关系。
分类分析:分类分析根据数据库中的不同类别的记录,按照一个特征,将其归为新的一类。
聚类分析:聚类分析法是将数据库的数据集,按某一特征放在相应的类型中。同分类分析法不同的是聚类分析并不知道预先的缺陷分类。聚类分析还可以采用不同的算法,可以对相同的记录集产生不同的划分,找出具有满足该条件但尚未发生故障的配电设备,以辅助设备的预检修处理。
3.3模型研发
这一步是数据挖掘工作的核心环节。虽然数据挖掘模型化工作涉及了非常广阔的技术领域,但若系统对应采用的技术有了明确的方向,系统的数据结构和内容也有了充分的适应性。采用合适的技术手段如数理统计方法、人工神经元网络、决策树等,就能很好的解决问题。
数理统计方法进行数据挖掘可进行各种不同类型模型、不同特点数据的分析,并能产生各种有用的统计量和诊断信息。人工神经元网络方法可用于相关性不强的多变量系统中。在系统的数据挖掘中使用哪一种方法,这主要取决于系统的数据集的特征和系统要实现的目标。
从上述过程中将会得出一系列的分析结果和模型,若能得出一个直接的结论当然很好,但更多的时候会得出对目标问题多侧面的描述。这时就要能很好的综合它们的影响规律性提供合理的决策支持信息。所谓合理,实际上往往是要系统在所付出的代价和达到预期目标的可靠性的平衡上作出选择。假如在系统的数据挖掘过程中,就预见到最后要进行这样的选择的话,那末系统最好把这些平衡的指标尽可能的量化,以利系统综合抉择。
系统提供的决策支持信息适用性如何,这显然是十分重要的问题。评价的办法之一是直接使用系统原来建立模型的数据来进行检验。说明系统确实从这批数据样本中挖掘出了符合实际的规律性。另一种办法是另外找一批数据,已知这些数据是反映客观实际的规律性的;这次的检验效果可能会比前一种差,若是差到系统所不能容忍程度,那就要考虑第一次构建的样本数据是否具有充分的代表性;或是模型本身不够完善,这时候可能要对前面的工作进行反思了;若这一步也得到了肯定的结果时,那系统的数据挖掘应得到很好的评价了。再一种办法是在实际运行的环境中取出实时数据进行检验。以上叙述的是数据挖掘的基本流程,这一过程可能是要反复进行的,在反复过程中,不断的趋近事物的本质,不断的优化系统问题的解决方案。
模型在使用以后,还必须严格考查模型的工作情况。值得一提的是,决定成败的并不是模型本身,而是根据模型所采取的行动,只有通过监测最终结果,才能正确地评价数据挖掘计划。
即使模型工作良好,也要坚持不断地监测模型的运行情况。随着时间的推移,所涉及的因素会有不同程度的发展和变化,这就需要经常重新测试、再训练、甚至可能是彻底重构模型。绘出预测值与观察值的差别图是监控模型结果的一个好方法,这样可使图表更加容易使用和理解,而且还可以建造到软件当中,实现系统的自监控。
3.4神经人工元网络
当预测模型中包含多种因素时,如制造、安装、气候、负荷、设备、人员对产生缺陷的综合影响,传统的分析方法受到很大局限。特别是缺陷同上述因素呈非线形关系时,传统的方法已不能很好地发挥作用。随着科学技术的迅速发展,预测理论技术也取得了极大的进步,新的预测方法不断出现,为故障预测提供了有力地工具,其中,神经网络理论是典型代表。神经网络理论模仿大脑的智能化处理,能对大量非结构化的、非精确性规律具有自适应功能,具有信息记忆、自主学习、知识推理和优化计算等特点,特别地,其自学习和自适应功能是常规算法和专家系统所不具备的,因此,神经网络理论是预测最有力的应用领域之一。在缺陷管理中,将对产生缺陷的因素作为输入,利用神经网络理论做出综合预测。
利用神经网络理论完成缺陷管理时,通过学习算法训练神经网络以做时间序列预测。通过设计一个简单的三层人工神经网络,就能实现从输入到输出间非线形映射任何复杂函数关系。三层人工神经网络分别为:输入层、输出层、中间层。中间层不与实际的输入、输出相连接,故又称为隐含层,隐含层使输入到输出层间可以映射任何函数关系。
神经网络的学习由四个过程组成:输入模式由输入层经中间层向输出层方向“模式顺序传播”,网络的期望输出和网络的实际输出之间的误差信号逆向逐层进行修正连接权的“误差逆序传播”。由“模式顺序传播”和“误差逆序传播”的反复交替进行的网络学习记忆训练过程,使网络趋向收敛。
将神经网络同AM/FM/GIS系统、110报修服务管理系统和SCARDA系统的结合,加强设备运行状况的全数据化管理是神经人工元网络应用于设备缺陷管理实现方法根本。实际上是一个“协同工作环境”中发现和解决配电缺陷的处理系统。
4.提高可靠性管理水平
建立缺陷管理系统完善配电网数据管理,缺陷管理系统需要完整的各类数据,因此,通过缺陷管理系统促进了配电网数据的管理,除利用缺陷管理系统统计分析设备缺陷外,还必须做好设备资料管理工作,将设备信息输入到缺陷管理系统的数据库中,利用计算机建立完整的设备基础数据台帐。
供电企业的服务对象是客户,利用缺陷管理系统提高服务质量,通过缺陷管理系统提供的数据,对配电设备的实行状态检修,实行状态检修实际上是减少对设备的停运机会,减少了客户的停电率,提高客户的满意度,使客户的年停电时间达到理想水平。从某种意义上讲,使客户满意是供电企业的最终目的。
安全及安全管理是供电企业生产活动中最为重视的环节,坚持“保人身、保电网、保设备”的原则。缺陷的存在,必然给安全生产带来威胁。如何针对问题,研究对策,把事故处理转移到故障预防上来,故障预测和预防是安全生产中值得研究的课题。安全及安全管理必须采用现代管理科学的方法,强调安全管理是一个系统,必须发挥系统的整体功能,依靠科学进步是改善劳动保护条件的根本出路。
缺陷管理系统是面向电业生产和管理的系统,系统在提高供电生产现代化管理水平方面能发挥巨大作用,最终将集中体现在提高供电部门经济效益方面所具有的实用价值上。从供电企业效益上看缺陷管理系统的实现,在提高配电网供电可靠性、供电业务管理水平、生产维护效率方面和树立企业形象方面,都将发挥重要作用。