内容提要:Google依靠搜索技术缔造了互联网的一个神话,并且“Google”已经作为人们解决问题时的一个动词,或互联网搜索技术的一个代名词。但是,在风云变换的互联网领域,神话在被缔造的同时,也是被用来打破的。在未来几年中,互联网搜索领域不再是Google公司一家独大,搜索技术也在趋于垂直搜索、社区搜索等更精确性搜索技术趋势发展。未来的搜索技术,会更专注于准确的语义搜索,为用户提供“一站式”解决问题的搜索技术。
【IT168 分析评论】在Wikipedia的创始人Jimmy Wales宣布计划在2007年上半年推出一个新的搜索引擎后,人们每天都在想还会有什么是Wales可以做到而Google不能做到的。
几年前,Google把人们心目中的搜索的尺度进行了重新校准,这直接导致了著名的韦氏字典将这家公司的名字——“Google”——定义为一个及物动词,成为搜索动作的另一种叫法。
尽管如此,搜索领域中的研究者和企业家都毫不怀疑地认为,总有一天Google将受到其他竞争对手的挑战,甚至被取而代之。
国外一家搜索引擎Web优化技术提供商SiteSpect的总裁Erik Hansen对此也持同样的看法,他认为:“这种情况不可避免地是会发生的,Google不可能永远高高在上。是的,现在Google是聚光灯下的焦点,但是许多睿智而又有资金支持的公司正在研发新的搜索技术,这些技术可能不同于Google现在所使用的技术,这些公司有一部分专注于解决更小范围或特定行业所面临的问题。他们不一定要大到像今天的Google一样大,但是沿着现在的道路走下去,相信这些小公司会有一个光明的前途。”
类似的搜索引擎覆盖的区域非常广泛,但是可以粗略的分为几大类,下面我们就一起来了解一下。
一、更善解人意的搜索引擎
当前以Google为代表的搜索引擎已经存在了很多年,随着技术的发展和人们需求的提高,搜索技术需要更加人性化和智能化。
1、“过滤”系统只搜你感兴趣的
IT技术领域有个现象,即某些最有意思的研究通常是在大学中率先进行的,对于这一点人们已经不认为是一件奇怪的事情。
美国乔治梅森大学的一位教授Larry Kerschberg去年获得了一个专利认可,原因是因为他研发了一套名为WebSifter的Web信息过滤系统,这个软件可以配合当前的搜索引擎使用,从而让用户获得非常好的的搜索结果。
WebSifter系统允许个人和公司首先从一个树形的分类中选择一项内容,用户搜索的时候并不是直接形成一个在Google中的关键词搜索,而是首先展开搜索同义的概念,然后再把他们提交给Google或其他搜索引擎。
WebSifer产生许多基于关键字的搜索请求给诸如Yahoo、Google之类的搜索引擎。每一个搜索引擎针对每一个搜索请求产生50个非常好的结果。然后,WebSfter基于它的专利算法来排列聚合的搜索结果,并将其展现给用户。通过这种方式,WebSifter获知了用户的喜好,并进行调整以提供更准确和相关性更强的搜索结果。
2、针对复杂的问题的搜索
国外搜索技术专家Kerschberg在WebSifter的基础上,创建了第二个针对在线搜索的系统,被称为“Knowledge Sifter”。这个应用程序解决了一个被搜索引擎用户频繁提到的一个问题:用户能否针对一个复杂的问题进行语义搜索?
当前的搜索技术对Web上的信息进行索引,之后来匹配关键词进行搜索,最后,它把用户指向到Web上可以发现这些数据的页面。由诸如Google、MSN和雅虎开发的算法来处理针对该元数据进行查询。
Kerschberg解释道,“举个例子说,有的人在被确诊患了癌症后,在网上搜索治疗的非常好的方法,他想知道有什么措施是可用的,最近的研究是什么,什么措施被事实证明是最好的。现在没有一个搜索引擎可以针对这样的搜索请求进行响应:‘哪一种方法是治疗我的癌症的非常好的方法?’”
为了解决这个问题,搜索引擎不得不了解用户的喜好,用户想要解决的问题和为什么他会首先问这个问题。
Kerschberg表示,一个包含了一个高级搜索引擎的中间件,或组合了一个合理的引擎的搜索网站,可以取出所有这些信息并使用它来匹配出用户需要的结果。
“这是搜索技术未来发展的方向,”Kerschberg预测道,“随着越来越多的资源被放到网络上,人们想要去查找的可能不是一个单纯的信息,而是通过一整套信息提取出来的一个答案。”
3、用于创新发现的新搜索引擎
Virginia大学的计算机教授Naren Ramakrishnan和他的学生已经开发了一个“用于创新发现”的搜索引擎,它也是强调数据之间的联系,一个用户最初可能不知道如何询问的问题。
这种搜索引擎被称为“Storyteller”,它能够发现表面无关的信息间的相互联系,得到一系列的相互关系或者事件、从而在特定的起点和终点之间形成链。“通过分析大量的文本或者其他数据,多个故事片断就会被拼接起来”。
Ramakrishna表示,有着很多东西等着我们进一步挖掘、发现并联系。大型的搜索引擎——如Google——可作为Storyteller的算法的参考。计算任务被分配每个超级计算机节点,每个任务带有一段生物学的文字描述作为索引。节点之间共享数据,有助于发现信息间的相互联系。
“在将来的工作中,我们准备模仿生物学家们的思考研究方式,用相应的方法在概念之间建立联系、生成信息链,”Ramakrishnan说,“我们的最终目标是产品化,研制数据推理和域理论的重要工具。”
搜索技术蛋糕待分食 Google独大地位受威胁
0
相关文章