【IT168分析评论】今年,企业级搜索市场成为继互联网搜索经济之后的又一大热点:Google、Yahoo 传统互联网搜索引擎厂商纷纷向企业搜索引擎市场发力;IBM、甲骨文、微软等IT 厂商也在向企业搜索市场渗透;国内内容管理厂商TRS、专注搜索技术的英国Autonomy 以及Verity 等公司更是在不余遗力地更新其搜索产品和技术。
新华通讯社信息管理应用服务系统担负着采集、发布、管理各类文字及图片信息的重大任务。其采集的信息涉及政治、外交、经济、文教、科技、法律等各个领域。目前,其多媒体数据库中已经存储了数千万条多媒体信息,数据容量接近8T,内容涵盖中、英、法、西、阿、俄等9 大主流语种。如何能够快速检索到所需要的有用信息呢?
一项调查显示,人们平均每天有四个问题需要从外界获取答案;其中31%的人使用搜索引擎寻找答案;据IBM 公司估计,公司员工在公司内部大约有30%的时间在查找信息;微软公司CEO 鲍尔默也曾表示,微软以前没有对互联网搜索技术投资是公司的一项重大失误,因此微软目前正在迎头赶上。
互联网搜索引擎技术已经深入人心,但如今类似新华社这样需求的客户越来越多,根据统计,企业数据每年以200% 的速度增长,其中80%的数据以文件、邮件、图片等非结构化数据存放在企业内计算机系统中的各个角落。而且这些数据总量远远超过了互联网信息的总量。有数字表明,企业发布到互联网的信息只占到信息量的 1%——2%,而98%以上的信息是存储在企业内部的。因此,如何方便,快捷,安全地获取企业内部的信息内容,造就了一个新的也是非常传统的应用——企业搜索引擎。
IT巨头连连出招企业搜索
正是看到互联网搜索引擎的巨大成功以及未来企业级搜索引擎的巨大市场空间,目前各大IT巨头都纷纷切入这一领域,并推出了相应的软件产品和技术。例如,Google的专用搜索设备不断出新,并推出了针对桌面的搜索引擎技术;百度早在2000 年就推出了针对企业搜索应用的网事通产品系列,Yahoo通过合作与并购的方式连连出招;传统的互联网搜索引擎厂商纷纷向企业搜索引擎市场发力。IBM 也于今年5月宣布推出其企业级搜索引擎技术——WebSphere II O m n i F i n d V e r s i o n 8 . 2 ;Microsoft 宣布将与Longhorn 同步推出搜索产品。另外,以内容管理起家的厂商也纷纷将企业搜索引擎作为重点,例如 T R S 不断升级其企业级搜索技术, Autonomy宣布将与中国网通合作在国内推出智能搜索引擎。一时间企业级搜索技术成为目前市场上抢眼的热点......
与互联网搜索引擎6 大区别
事实上,企业搜索引擎(Enterprise Search Engine,简称ESE)可以理解为“企业级”搜索引擎,其应用领域并非指单纯的企业,政府、教育、科研、媒体、医疗、军队、安全部门都有类似的应用需求。那么,企业级搜索引擎和互联网搜索引擎相比,有哪些不同呢?百度企业软件事业部运营总监王啸指出,企业搜索引擎工具与互联网搜索引擎的核心技术基本相同,如采集、检索等;不同之处在于企业搜索对相关核心技术的要求更高,如采集的效率更快,全面性更强,深度更深,而且能够定向定量采集;检索则更加注重个性化检索,以信息内容为核心的相关度排序方式,个性化推送,甚至还包括自动分类、聚类、语义分析等对信息的组织和有序化技术。王啸强调,企业搜索并不是简单的将互联网搜索技术拿到企业内部来用,而是对企业内外部数据的高效获取和有效组织的技术和过程,它不仅仅包括互联网搜索的相关技术,还包括一系列对于非结构化数据的组织、分析和管理技术等。
TRS公司总裁施水才则从6个方面指出了其中区别:首先是数据结构的不同。互联网上的数据组织形式都是基于 HTML组成的网页。而企业级用户需要搜索的数据既有互联网站点上的,也有内部网站点上的;既有网页形式的,又有各种数据库形式的,如SQL Server、Oracle 数据库等;既有结构化数据,而更多的是各种电子文件格式的非结构化及半结构化数据,如Word、Excel、Lotus Notes、PDF、 XML 等;既有文本形式的数据,还有多媒体形式的数据;而且,同一机构的数据还可能分布在不同的介质载体上。
第二是安全性考虑。在企业内部,安全的问题是无法回避的。因此,针对企业网中不同的用户对不同的资源,其使用权限都可能不一样,需要企业搜索引擎能够对用户、资源、权限分级管理和控制,确保系统的安全。
第三是对查全和查准的需求。企业用户需要查找的信息专业性强、概念复杂,而对查询的查全率和查准率有着非常高的要求。
第四是检索的智能化需求。在企业内部的搜索结果将直接参与到企业的运行、决策中,所以,对于搜索的结果处理,搜索过程中采用相关智能技术以达到迅速,准确,全面定位目标信息非常重要。
第五企业搜索引擎通常都和企业的其他IT应用有机结合。企业搜索引擎通常与数据管理、内容管理、记录管理、竞争情报、团队协同、过程管理、信息门户等知识管理的各个环节密切结合,构成管理企业知识资产的完整而又灵活的体系。
第六是对信息搜索服务的实时性要求。企业搜索引擎提供的服务,必须是能够动态反映实际情况的。就是说当内部的信息发生变化时,必须能够实时反应。