搜索技术蛋糕待分食 Google独大地位受威胁-技术开发专区

搜索技术蛋糕待分食 Google独大地位受威胁

作者：IT168 东方蜘蛛编辑：赵建凯 2007-04-03 08:32

内容提要：Google依靠搜索技术缔造了互联网的一个神话，并且“Google”已经作为人们解决问题时的一个动词，或互联网搜索技术的一个代名词。但是，在风云变换的互联网领域，神话在被缔造的同时，也是被用来打破的。在未来几年中，互联网搜索领域不再是Google公司一家独大，搜索技术也在趋于垂直搜索、社区搜索等更精确性搜索技术趋势发展。未来的搜索技术，会更专注于准确的语义搜索，为用户提供“一站式”解决问题的搜索技术。

【IT168 分析评论】在Wikipedia的创始人Jimmy Wales宣布计划在2007年上半年推出一个新的搜索引擎后，人们每天都在想还会有什么是Wales可以做到而Google不能做到的。

    几年前，Google把人们心目中的搜索的尺度进行了重新校准，这直接导致了著名的韦氏字典将这家公司的名字——“Google”——定义为一个及物动词，成为搜索动作的另一种叫法。

    尽管如此，搜索领域中的研究者和企业家都毫不怀疑地认为，总有一天Google将受到其他竞争对手的挑战，甚至被取而代之。

    国外一家搜索引擎Web优化技术提供商SiteSpect的总裁Erik Hansen对此也持同样的看法，他认为：“这种情况不可避免地是会发生的，Google不可能永远高高在上。是的，现在Google是聚光灯下的焦点，但是许多睿智而又有资金支持的公司正在研发新的搜索技术，这些技术可能不同于Google现在所使用的技术，这些公司有一部分专注于解决更小范围或特定行业所面临的问题。他们不一定要大到像今天的Google一样大，但是沿着现在的道路走下去，相信这些小公司会有一个光明的前途。”

    类似的搜索引擎覆盖的区域非常广泛，但是可以粗略的分为几大类，下面我们就一起来了解一下。

    一、更善解人意的搜索引擎

    当前以Google为代表的搜索引擎已经存在了很多年，随着技术的发展和人们需求的提高，搜索技术需要更加人性化和智能化。

    1、“过滤”系统只搜你感兴趣的

    IT技术领域有个现象，即某些最有意思的研究通常是在大学中率先进行的，对于这一点人们已经不认为是一件奇怪的事情。

    美国乔治梅森大学的一位教授Larry Kerschberg去年获得了一个专利认可，原因是因为他研发了一套名为WebSifter的Web信息过滤系统，这个软件可以配合当前的搜索引擎使用，从而让用户获得非常好的的搜索结果。

    WebSifter系统允许个人和公司首先从一个树形的分类中选择一项内容，用户搜索的时候并不是直接形成一个在Google中的关键词搜索，而是首先展开搜索同义的概念，然后再把他们提交给Google或其他搜索引擎。

    WebSifer产生许多基于关键字的搜索请求给诸如Yahoo、Google之类的搜索引擎。每一个搜索引擎针对每一个搜索请求产生50个非常好的结果。然后，WebSfter基于它的专利算法来排列聚合的搜索结果，并将其展现给用户。通过这种方式，WebSifter获知了用户的喜好，并进行调整以提供更准确和相关性更强的搜索结果。

    2、针对复杂的问题的搜索

    国外搜索技术专家Kerschberg在WebSifter的基础上，创建了第二个针对在线搜索的系统，被称为“Knowledge Sifter”。这个应用程序解决了一个被搜索引擎用户频繁提到的一个问题：用户能否针对一个复杂的问题进行语义搜索？

    当前的搜索技术对Web上的信息进行索引，之后来匹配关键词进行搜索，最后，它把用户指向到Web上可以发现这些数据的页面。由诸如Google、MSN和雅虎开发的算法来处理针对该元数据进行查询。

    Kerschberg解释道，“举个例子说，有的人在被确诊患了癌症后，在网上搜索治疗的非常好的方法，他想知道有什么措施是可用的，最近的研究是什么，什么措施被事实证明是最好的。现在没有一个搜索引擎可以针对这样的搜索请求进行响应：‘哪一种方法是治疗我的癌症的非常好的方法？’”

    为了解决这个问题，搜索引擎不得不了解用户的喜好，用户想要解决的问题和为什么他会首先问这个问题。

    Kerschberg表示，一个包含了一个高级搜索引擎的中间件，或组合了一个合理的引擎的搜索网站，可以取出所有这些信息并使用它来匹配出用户需要的结果。

    “这是搜索技术未来发展的方向，”Kerschberg预测道，“随着越来越多的资源被放到网络上，人们想要去查找的可能不是一个单纯的信息，而是通过一整套信息提取出来的一个答案。”

    3、用于创新发现的新搜索引擎

    Virginia大学的计算机教授Naren Ramakrishnan和他的学生已经开发了一个“用于创新发现”的搜索引擎，它也是强调数据之间的联系，一个用户最初可能不知道如何询问的问题。

    这种搜索引擎被称为“Storyteller”，它能够发现表面无关的信息间的相互联系，得到一系列的相互关系或者事件、从而在特定的起点和终点之间形成链。“通过分析大量的文本或者其他数据，多个故事片断就会被拼接起来”。

    Ramakrishna表示，有着很多东西等着我们进一步挖掘、发现并联系。大型的搜索引擎——如Google——可作为Storyteller的算法的参考。计算任务被分配每个超级计算机节点，每个任务带有一段生物学的文字描述作为索引。节点之间共享数据，有助于发现信息间的相互联系。

    “在将来的工作中，我们准备模仿生物学家们的思考研究方式，用相应的方法在概念之间建立联系、生成信息链，”Ramakrishnan说，“我们的最终目标是产品化，研制数据推理和域理论的重要工具。”

第1页：更善解人意的搜索引擎第2页：更细化的搜索——垂直搜索第3页：社区搜索第4页：跳出文字的图像搜索引擎

关注我们