谷歌对策
前华盛顿大学计算机教授阿龙-哈勒维(Alon Halevy)现在就在谷歌领导一个研发小组,试图解决“深层网络”的问题。他说:“这是我们所能想象到的最为有趣的数据集成问题。”
谷歌的“深层网络”搜索战略将会对外发送一个程序并对其所遇到的所有数据库进行分析。例如,如果搜索引擎找到一个与美术相关的页面,它就会开始猜测有可能的搜索项,例如“伦勃朗”、“毕加索(Picasso)”和“费米尔(Vermeer)”等艺术大师的名字,直到其中一个搜索项返回匹配信息。随后,搜索引擎还会分析结果并针对数据库的数据开发预测模式。
与此类似,犹他大学的朱莉安娜-弗雷尔(Juliana Freire)也在从事一项意义深远的项目。这个名为DeepPeep的项目希望最终能够遍历并索引公共网络中的所有数据库,从中提取广泛的数据以匹配复杂的搜索需求。
弗雷尔说:“如果像查询字典中的每个字一样去从事这项工作,那就未免太天真了。”费雷尔并没有采取这种方式,而是从一小部分样本查询开始入手,她说:“通过这种方式,我们就可以建立起对于数据库的理解,并选择究竟需要搜索哪些文字。”
基于这种分析,程序会自动对数据库发送搜索项,并借此提取尽可能多的数据。费雷尔称,她的方法对任何数据库内容的检索比例都超过90%。她的研究成果最近还吸引了一家主流搜索引擎公司的注意。
随着主流搜索引擎也开始尝试将“深层网络”的内容整合到其索引结果中,它们一方面需要展示不同种类的数据,另一方面又不能使得页面过于复杂。这对于谷歌而言尤其困难,因为他们长期以来都对大幅更改自己那“久经考验”的搜索格式非常抗拒。
专门研究搜索引擎的美国网站Search Engine Land执行主编克里斯-谢尔曼(Chris Sherman)说:“谷歌面临着严峻的挑战。他们希望提供更好的用户体验,但是却非常担心自己的改变会疏远用户。”
企业领域
除了消费级搜索领域之外,“深层网络”技术最终还有可能为企业提供新的数据使用方式。例如,一个健康网站可以交叉参考多个制药公司的最新医药研究数据,而本地新闻网站则可以通过提取政府数据库中的公共记录来对事件进行延伸报道。
这种程度的数据集成最终将演变成“语义网络(Semantic Web)”,这是一种被大肆炒作但尚未实现的概念,这种网络将实现数据之间的相互连接。但是这一概念的发展遭遇到了一定的挑战,因为这种概念想要成形,就需要所有人都提供必要的建议。“深层网络”技术有望达到类似的效果但消耗的成本却更小,因为它能够自动分析数据库结构以及交叉参考的结果。
参与编撰“深层网络”这一术语的麦克-伯格曼(Mike Bergman)说:“‘深层网络’的最大优点在于能够将彼此独立的数据资源联系起来。”他认为,从长期来看,“深层网络”搜索对企业的影响要大于普通用户。
谷歌面临新兴搜索技术挑战
0
相关文章