技术开发 频道

Tivoli实现IT基础架构管理

2. 故障管理
    对于企业的应用系统来说,故障管理是企业IT基础架构管理的核心。网络、设备、各种分布式的系统、数据库系统、中间件和各种应用程序都会产生各自的事件。对于大型服务器系统,一个系统管理员往往要面对成百上千个不同的事件,负担很重。而且,由于事件量大,关系不清楚,管理员很难在众多事件中分出事件的重要程度,难以把重点放在关键事件上,同时也难以对问题进行准确的分析。由于各种事件(例如网络、系统、数据库和应用事件)之间有相关性,因此对事件进行统一处理可以大大提高管理效率,加快故障分析定位和故障处理,降低由于系统故障带来的损失。
    作为快速高缩放性的事件收集和结合平台,Tivoli Netcool Omnibus管理着每天超过2~3千万的网络基础架构的事件流,并以1000:1或更大的比率压缩。Netcool能够从200多种管理数据源收集事件,提供一个综合的集中化故障管理中心,以便管理持续增长的异构和分布架构,这都是实时实现的。

    Chase通过Tivoli Netcool进行故障压缩和相关性分析,每天2百万条事件经过压缩后为6000条,压缩比为333:1。通过为不同监控人员提供过滤的信息显示,每个操作员监控屏幕的界面为80条。
    除了功能强大的故障事件压缩和处理能力外,Tivoli Netcool还提供丰富的事件内容和灵活的事件翻译功能,一般包含事件的节点、类型和级别等50多个字段。但是,用户实际的管理中往往要求在事件中增加所需的管理内容,包括有关事件节点的位置、联系人、线路名称、运营商名称、关键资源信息和相关业务等,这些信息可以帮助管理人员在收到故障报警时,能够迅速了解故障相关的资源、人员和业务等信息,快速做出反应。例如,有关线路的事件可以显示节点、端口、下联单位、运营商、联系人和线路号等,而有关性能的事件可能显示节点、性能参数、当前性能值、设备位置和联系人等。这种灵活定制的事件显示可以更进一步地方便管理人员对故障信息的监控和查看。
    当新发生的事件信息满足预先定制的分类条件时,Tivoli管理软件提供的丰富的事件通知功能。事件通知方式包括:

  • Mail  自动向指定邮箱发送告警邮件。
  • 短信  自动向指定手机发送告警短信。
  • 声音  自动产生声音告警。
  • 图像  自动以图标形式显示告警事件。
  • 语音  利用语音系统自动产生告警电话。
  • 文件  自动在指定位置生成指定文件。
  • 其它  通过二次开发可实现客户特殊要求的告警方式。

3. 开放的管理体系
    对于企业来说,来自单一厂商的管理工具所提供的管理功能很难覆盖企业IT基础架构管理的全部需求,对于第三方监控工具和管理系统的集成能力是评价企业管理产品架构是否灵活的重要标准。Tivoli Netcool内置的Probe共有200多种,它们不但能帮助操作员从各种网络管理控制台、传输基础设施、电话设备、数据网络、LAN、WAN及应用中收集和转换信息,还能从领先厂商的交换机和路由器收集MIB信息,包括Bay Networks、Cabletron、Micromuse和N.E.T。我们还为CMIP、ASCII、TL1、业界标准UNIX及许多厂商专用协议提供Probe。
    除了专门的监控代理外,Tivoli管理软件还提供通用代理(Universal Agent,简称UA)。从技术上说,UA提供了各种数据接口(Data Provider)来和各种第三方监控数据或代码进行集成,从而实现将第三方监控(例如空调、门禁、UPS或特定应用管理工具等)完全变为监控系统的一部分。Tivoli管理软件还支持八种Data Provider,这八种Data Provider分别是API、SOCK、FILE、SCRIPT、SNMP、ODBC、POST和HTTP。实施人员总可以找到一种自己熟悉的接口方式进行开发。UA简单易学,只需简单的定制工作就可以将数据源程序发送来的数据集成到监控系统中。下图为一个机房和电力监控系统整合的实例,UA通过File的接口方式获取监控数据,并放到TEP上进行集中的告警和展示,性能数据统一存放到后台数据仓库中。


  

全面整合的管理解决方案

    IBM Tivoli不仅为用户的IT子系统单独提供价值,还能够很好地整合起来,从而实现真正整合的企业系统管理方案。采用IBM Tivoli解决方案构建的管理平台包括IBM Tivoli Netcool网络管理、IBM Tivoli Monitoring(ITM)主机/数据库/中间件/群件等管理、IBM Tivoli Composite Application Manager(ITCAM)交易监控、IBM Tivoli Storage Manager(TSM)备份管理、IBM Tivoli Productivity Center(TPC)存储管理和IBM Tivoli Enterprise Portal(TEP)统一管理门户。面对不同的管理对象,IBM Tivoli提供不同的工具,使用不同的技术手段来进行管理。
    由此可见,IBM Tivoli全方位的IT基础架构解决方案管理平台,对企业的业务价值提升成效显著,主要表现在:

  • 提高业务连续性;
  • 提供更快速的业务服务能力;
  • IT管理部门更加理性和从容地进行管理;
  • 从被动应急模式改变为主动模式;
  • 具有更好的灾难抵御能力。

参考资料:
    IBM Tivoli Monitoring Administrator’s guide (管理员指南)
    IBM Tivoli Netcool Omnibus Administrator’s guide (管理员指南)

0
相关文章