内容提要:Google依靠搜索技术缔造了互联网的一个神话,并且“Google”已经作为人们解决问题时的一个动词,或互联网搜索技术的一个代名词。但是,在风云变换的互联网领域,神话在被缔造的同时,也是被用来打破的。在未来几年中,互联网搜索领域不再是Google公司一家独大,搜索技术也在趋于垂直搜索、社区搜索等更精确性搜索技术趋势发展。未来的搜索技术,会更专注于准确的语义搜索,为用户提供“一站式”解决问题的搜索技术。
【IT168 分析评论】在Wikipedia的创始人Jimmy Wales宣布计划在2007年上半年推出一个新的搜索引擎后,人们每天都在想还会有什么是Wales可以做到而Google不能做到的。
几年前,Google把人们心目中的搜索的尺度进行了重新校准,这直接导致了著名的韦氏字典将这家公司的名字——“Google”——定义为一个及物动词,成为搜索动作的另一种叫法。
尽管如此,搜索领域中的研究者和企业家都毫不怀疑地认为,总有一天Google将受到其他竞争对手的挑战,甚至被取而代之。
国外一家搜索引擎Web优化技术提供商SiteSpect的总裁Erik Hansen对此也持同样的看法,他认为:“这种情况不可避免地是会发生的,Google不可能永远高高在上。是的,现在Google是聚光灯下的焦点,但是许多睿智而又有资金支持的公司正在研发新的搜索技术,这些技术可能不同于Google现在所使用的技术,这些公司有一部分专注于解决更小范围或特定行业所面临的问题。他们不一定要大到像今天的Google一样大,但是沿着现在的道路走下去,相信这些小公司会有一个光明的前途。”
类似的搜索引擎覆盖的区域非常广泛,但是可以粗略的分为几大类,下面我们就一起来了解一下。
一、更善解人意的搜索引擎
当前以Google为代表的搜索引擎已经存在了很多年,随着技术的发展和人们需求的提高,搜索技术需要更加人性化和智能化。
1、“过滤”系统只搜你感兴趣的
IT技术领域有个现象,即某些最有意思的研究通常是在大学中率先进行的,对于这一点人们已经不认为是一件奇怪的事情。
美国乔治梅森大学的一位教授Larry Kerschberg去年获得了一个专利认可,原因是因为他研发了一套名为WebSifter的Web信息过滤系统,这个软件可以配合当前的搜索引擎使用,从而让用户获得非常好的的搜索结果。
WebSifter系统允许个人和公司首先从一个树形的分类中选择一项内容,用户搜索的时候并不是直接形成一个在Google中的关键词搜索,而是首先展开搜索同义的概念,然后再把他们提交给Google或其他搜索引擎。
WebSifer产生许多基于关键字的搜索请求给诸如Yahoo、Google之类的搜索引擎。每一个搜索引擎针对每一个搜索请求产生50个非常好的结果。然后,WebSfter基于它的专利算法来排列聚合的搜索结果,并将其展现给用户。通过这种方式,WebSifter获知了用户的喜好,并进行调整以提供更准确和相关性更强的搜索结果。
2、针对复杂的问题的搜索
国外搜索技术专家Kerschberg在WebSifter的基础上,创建了第二个针对在线搜索的系统,被称为“Knowledge Sifter”。这个应用程序解决了一个被搜索引擎用户频繁提到的一个问题:用户能否针对一个复杂的问题进行语义搜索?
当前的搜索技术对Web上的信息进行索引,之后来匹配关键词进行搜索,最后,它把用户指向到Web上可以发现这些数据的页面。由诸如Google、MSN和雅虎开发的算法来处理针对该元数据进行查询。
Kerschberg解释道,“举个例子说,有的人在被确诊患了癌症后,在网上搜索治疗的非常好的方法,他想知道有什么措施是可用的,最近的研究是什么,什么措施被事实证明是最好的。现在没有一个搜索引擎可以针对这样的搜索请求进行响应:‘哪一种方法是治疗我的癌症的非常好的方法?’”
为了解决这个问题,搜索引擎不得不了解用户的喜好,用户想要解决的问题和为什么他会首先问这个问题。
Kerschberg表示,一个包含了一个高级搜索引擎的中间件,或组合了一个合理的引擎的搜索网站,可以取出所有这些信息并使用它来匹配出用户需要的结果。
“这是搜索技术未来发展的方向,”Kerschberg预测道,“随着越来越多的资源被放到网络上,人们想要去查找的可能不是一个单纯的信息,而是通过一整套信息提取出来的一个答案。”
3、用于创新发现的新搜索引擎
Virginia大学的计算机教授Naren Ramakrishnan和他的学生已经开发了一个“用于创新发现”的搜索引擎,它也是强调数据之间的联系,一个用户最初可能不知道如何询问的问题。
这种搜索引擎被称为“Storyteller”,它能够发现表面无关的信息间的相互联系,得到一系列的相互关系或者事件、从而在特定的起点和终点之间形成链。“通过分析大量的文本或者其他数据,多个故事片断就会被拼接起来”。
Ramakrishna表示,有着很多东西等着我们进一步挖掘、发现并联系。大型的搜索引擎——如Google——可作为Storyteller的算法的参考。计算任务被分配每个超级计算机节点,每个任务带有一段生物学的文字描述作为索引。节点之间共享数据,有助于发现信息间的相互联系。
“在将来的工作中,我们准备模仿生物学家们的思考研究方式,用相应的方法在概念之间建立联系、生成信息链,”Ramakrishnan说,“我们的最终目标是产品化,研制数据推理和域理论的重要工具。”
二、更细化的搜索——垂直搜索
有人把2007年称为垂直搜索年,那么什么是垂直搜索?垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,对网页库中的某类专门的信息进行一次整合,抽取出需要的数据进行处理后再以某种形式返回给用户。
垂直搜索的特点就是“专、精、深”,而且还省时省力。与通用搜索引擎的海量信息无序化相比,垂直搜索引擎显得更加专注、具体和深入。有调查数据显示,六成的网民将会比较关注面向某些领域的专业搜索引擎。现在网民的要求已经从“搜全”向“搜全+搜准”转移。
垂直搜索现在都是一个热点,在国内来说,各种各样的行业搜索已经非常多,但是目前规模还比较小,还需要时间来证明它们自己的实力和潜力。另外,那些传统搜索厂商(诸如微软、雅虎等)也已经试水垂直搜索。举个例子来说,微软最近收购了健康搜索引擎Medstory,其意就是让自己在消费者健康行业留下微软的足迹。
垂直化是最近刚刚出现的搜索引擎的发展趋势之一,但是它已经对搜索业的方向产生了一定影响。垂直搜索给用户带来的好处是显而易见的。在一个搜索引擎中,一个用户搜索关于癌症的信息,其得到想要的搜索结果的准确度要远远大于普通的搜索引擎。
三、社区搜索
YouTube的神话正在让互联网朝着社区化的方向飞速发展,用户希望获得可信任信息。社区搜索极有可能将成为网络搜索的下一阶段。
社区搜索旨在为社区里有着共同兴趣和爱好的用户提供一个个性化的搜索平台。与传统搜索最大的差别就是打破了以往由机器搜索决定搜索结果的重要性和排序。在这里,社区成员是决定者,他们的喜好推荐和搜索习惯决定着搜索的顺序。
这种新的搜索方式的出现主要是为迎合两方面的问题:一是网络社区化越来越明显,用户越来越需要个性化的搜索体验;二是现行传统搜索的机械性所导致的搜索低效。
在国内搜索市场,已经有公司在社区化搜索上面做出一些努力。如百度的贴吧、搜狗的说吧等,这种趋势延伸出了搜索引擎社区化,它让搜索与用户互动起来。百度首席产品设计师俞军评价到:“搜索引擎社区化是由用户需求驱动的,它有着无限的成长潜能。”
在国际搜索市场上,雅虎的反应是比较迅速的,相继收购了Flickr、del.icio.us和在线编辑视频新秀Jumpcut,建立Yahoo!My Web2.0,意图奠定社区化搜索老大的地位,扳回在传统搜索市场上一直输于Google的局面。
面对压力,Google在去年也开始发力,以天价收购大型视频社区网络YouTube为契机,先后推出Searchmash和Custom Search Engine两款社会化搜索服务。
搜索巨头的积极反应确实让我们看到新搜索时代的趋势:社区化搜索。
四、跳出文字的图像搜索引擎
图像搜索也正在从那些正开发下一代搜索技术的公司中获得更多的动力。用户对网上图像搜索的要求也在不断增长,使各种基于Web的图像搜索引擎应运而生。它们各自以不同的工作方式,使用户对网上图像信息的搜索变得非常简单——尽管还不很完美,却已经可以满足用户的大多数要求。
当前大多数图像搜索引擎使用“标签”或关键词来关联到图像,利用这些信息可以最终来匹配搜索图像。但是,这种方式已经被证明是不可靠的。经常有用户反映这种“基于标签”的搜索引擎最终不能返回匹配准确的搜索结果。
还有一种高级的图像搜索技术,即基于图像形式特征的抽取。由图像分析软件自动抽取图像的颜色、形状、纹理等特征,建立特征索引库。用户只需将要查找的图像的大致特征描述出来,就可以找出与之具有相近特征的图像。用户使用这种“基于内容”的搜索方法可以得到更准确的搜索图像结果。
美国国防部计算机犯罪中心最近开始评估LTU技术公司的Image-Seeker和Image-Filter软件,这些软件被用于测试和分析大量图像和促进法庭辩论视频的调查。Image-Seeker是一种利用数字签名或图像DNA进行索引、识别,根据具体视频特性描述图像的可视搜索引擎。Image-Seeker软件可以升级并允许用户查找、复制类似的图像。Image-Filter软件可以实时分析图像和视频流的内容。Image-Seeker 和 Image-Filter软件都采用了LTU公司的视频模块,这种视频模块采用了最初用于法律和情报部门客户的比较和分级特征,是一种通用图像分析平台。这项工具软件将在识别、分析、索引证据和敏感信息方面起到重要作用。
五、总结
尽管Google靠搜索缔造了互联网界的一个神话,似乎让其他公司都难以颠覆它在搜索领域的霸主地位。但是,对于发展变化迅速的互联网来说,如果Google不能勇于创新的话,恐怕也难免被互联网所缔造的“另一个Google”所取代。