技术开发 频道

企业信息搜索软件—IBM OmniFind特性简介

IBM OmniFind 特点

支持广泛的企业数据源,系统扩展性强

    OmniFind 不仅能够广泛地支持企业中的各种数据源,而且能够很好地了解企业中各种数据源之间的差异性,能够自动发现各类数据源及其元数据,配置管理非常方便;这将大大降低系统开发和运维的复杂度,也为未来系统数据源的扩展带来便利。

    OmniFind 提供基于 Web 的,界面友好的统一管理控制台。通过该控制台进行简易的配置即可完成对各种企业数据源的搜寻。

    OmniFind 在提供统一的配置管理方式的同时,又能够很好地了解企业中各种数据源之间的差异性,能够非常好地自动发现 (Auto Discovery) 各类数据源及其元数据 (Metadata)。

    管理员还可以通过图形管理界面配置爬虫器要搜寻哪些类型数据源、不要搜寻哪些数据、何时搜寻、重新搜寻或增量搜寻的频率等等。

    OmniFind 友好的统一管理界面和自动发现能力使管理人员可以在很短的时间内用图形管理界面将数据源定义好,这不像其它厂商需要对配置文件进行人工编辑,从而大大提高了生产力,缩短项目周期,同时也方便了搜索系统的管理和数据源扩展。

    OmniFind 对数据的采集是通过爬虫器 (Crawler) 完成的。通过在 OmniFind 的管理控制台上进行简易的配置即可完成对各种企业数据源的搜寻。IBM OmniFind 管理配置简单,对关系型数据库数据源,OmniFind 管理控制台可以自动发现数据库中的表及表的字段,由用户自行选择。界面如下:


图 2. 选择要搜寻的数据库





图 4. 配置要搜寻的字段

灵活的元数据扩展能力

    OmniFind 的元数据扩展能力是通过元数据插件 (Metadata Plug-in) 来实现的。OmniFind 通过 Metadata Plug-in 可以很好地将两个分离的、但又存在业务逻辑关联的数据源联系在一起进行搜寻。扩展能力强,而且非常灵活。

管理和监控简便,最大限度地降低系统的运维成本

    OmniFind 非常便于安装和管理,所以使用很短的时间即可建立和运行企业搜索应用程序。管理员仅需指定搜索从何处开始到何处结束和刷新索引的频度。OmniFind 设计用于减少 IT 人员的管理需求,其分析特性是透明的,可以最大限度地减少完成高质量搜索结果所需的管理任务。使用 OmniFind,可以方便地定义合适的安全性、监控系统活动并解决发生的各种问题。

    OmniFind 通过一个基于 Web 的管理控制台 (ESAdmin),实现统一的管理和监控。有自动发现数据源和元数据的能力,使得配置过程非常智能化,不需要手工编辑繁琐的配置文件。

    另外,还可以非常方便地配置定时进行自动爬数据源、分析和建索引等操作。统一友好的用户界面和定时功能将大大节约系统的运维成本。

    此外,OmniFind 管理控制台还是一个基于角色的管理平台,可以创建不同角色的管理员,实现管理上的安全控制。

搜索方式灵活全面、搜索结果准确

    OmniFind 搜索准确灵活。除了基本搜索外,还可以进行灵活的高级搜索,包括根据数据源、文档类型、文档大小、文档语言等对结果进行筛选。

    此外,管理员还可以为经常被用户搜索的关键词配置快速联接。有效提高了用户的搜索企业信息效率。

    OmniFind 支持对搜索要求的多国语言自动分词能力。OmniFind 不仅提供自动分词能力,而且基于分词功能提供选项支持对用户输入的查询请求进行拼写较正,基于校验后的结果进行搜索。

    OmniFind 支持动态文档摘要的生成能力。OmniFind 在返回结果时,可以自动根据搜索串对文档进行动态的摘要处理。

    OmniFind 提供了完善的 Java API 接口,用户可以在此基础上定义自己的搜索应用,OmniFind 提供专门的搜索语言,支持全文检索基础上对属性信息的过滤和与或等多种组合匹配方式,通过客户化编程,可实现独立存储的元数据属性信息和全文信息结合的搜索。应用可灵活定义搜索需求。搜索结果提供动态摘要及匹配度信息,对命中的词汇进行高亮显示。

    OmniFind 提供了对结果的排序能力。其排序方式支持两种。一种为 Text based scoring,动态计算匹配度评分。另外还支持 Static Ranking,能够根据文档本身的因素(如:文档被引用的计数值或文档的时间戳)对范围结果的排序产生影响。

    OmniFind 还提供了二次检索能力。OmniFind 所返回的结果中包含搜索的查询串信息。二次查询实现时,是将在第一次搜索的查询串基础上添加新的查询要求。OmniFind 二次查询时,将首先从 cache 中提取信息,这种方式无疑将大幅缩短查询时间,提高查询效率。


图 5. OmniFind 搜索结果


全方位安全机制,可以支持 IBM Content Manager 等数据源内部安全机制

    数据资源的安全性是构建一个企业级搜索引擎需要考虑的重要因素。OmniFind 提供了多种搜索安全控制机制,包括有管理级别安全、搜索应用级别安全、集合级别安全和文档级别安全。可以根据客户的具体安全性需求进行灵活多样的安全控制。

    OmniFind 还支持对多种数据源(如 IBM CM)的内部安全性支持。这是其他任何厂商所做不到的。

    此外,OmniFind 还对 LDAP 有很好的支持。

    OmniFind 提供了多种搜索安全控制机制,包括有管理级别安全、搜索应用级别安全、集合级别安全和文档级别安全。


图 6. 安全性

    用户也可以通过安全插件 (security plug-in) 可以为每个文档定义搜索权限,确保用户无法检索到其没有得到查看授权的信息。

    集合级 (collection level security) 的访问控制主要与企业应用配合,可以控制某个部门的搜索应用能够搜索的集合。文档级 (document level security) 访问控制,可以将用户与可访问的文档直接关联。其授权是通过设置安全性令牌(Token)实现。

    OmniFind 提供的机制允许在对文档进行抓取 (Crawl) 的同时,为每个文档设置安全令牌信息。该令牌信息可以是操作系统 ID, 用户 ID, 组 ID 等,设置安全性令牌可以由管理员指定、预定义,通过 API 由用户自定义等多种实现方式。


图 7. 安全性示例

    简而言之,OmniFind 安全模型提供了一种机制,可以在搜索时间将安全标记与每个文档相关联,而在查询时间将安全标记与用户查询相关联。在查询期间,索引可以非常高效地进行文档过滤,所以用户只能查看其具有查看授权的那些文档。另外,OmniFind 的安全控制机制还可以与企业现有的内部安全机制集成使用。

完善的客户化开发接口,能够与企业现有系统 (WebSphere Portal) 无逢集成

    OmniFind 提供了给用户完善的二次开发接口以便于与现有应用系统集成。尤其在与 WebSphere Portal 的集成方面是其他任何厂商所无法比拟的。

    OmniFind 提供基于 Java 的 Search & Index API,可以很快的将 OmniFind 集成到现有的企业门户或应用系统中。同时 OmniFind 自带了多个 Java 应用范例供开发人员参考。OmniFind 还提供一个基于 J2EE 的搜索应用程序示例 ( 即 ESSearchApplication) 和一个 Portlet(如图 8 所示),用户可以将该应用程序示例用于创建满足组织独特需求的搜索应用程序的模板。


图 8. OmniFind 和 WebSphere Portal 的集成

系统可用性高,可扩展性强

    IBM OmniFind 提供了优越的性能,可扩展性以及高质量的搜索结果集,可以快速访问企业中广泛的信息源。IBM OmniFind 提供三种部署方式,可以满足不同企业的应用需求:

单节点配置方案

    如图 9 所示,在一台服务器(节点)上部署 OmniFind 的所有部件。该部署方案可支持上百万文档量。


图 9. 单节点配置方案


双节点配置方案

    该部署方案具有企业级扩展能力,可支持百万级以上文档量,同时具有支持负载均衡和能够避免单点故障的特点,可支持 7 X 24 小时高可用性。


图 10. 双节点配置方案

四节点配置方案

    该部署方案具有企业级扩展能力,可支持千万级以上文档量,同时具有支持负载均衡和能够避免单点故障的特点,可支持 7 X 24 小时高可用性。



图 11. 四节点配置方案

    OmniFind 还在全球最具挑战的 Intranet 上证明了它的强大功能和可扩展性——IBM 的 Intranet 有超过 300,000 人员使用搜索服务。

0
相关文章