实时+智能
不久之前,大量来自政府的研究数据被刻录在了一些光盘上,人们花费了3到6个月的时间才把这些信息变成一些能用的东西。在信息制作完成后的几秒钟内即可进行访问的能力改变了所有人的观念,但对早期搜索领域的科研人员来说,实时搜索却几乎不可能实现。
2009年12月,Google推出了实时搜索业务,这是我有生以来经历过的最复杂的项目之一。我们开发了十多种新技术,以近乎即刻的速度决定 最新信息的相关性,比如从经过缩短的URL中提取信息、从世博会新闻中提取有意义的内容,以及评估查询量的变化以找出热点话题等。去年加州爆发地震 时,Google实时搜索开始显示这一信息的时间比美国地质调查局的官方报告整整提前了8分钟。
计算机已经慢慢学习着翻译语言,但是,如何让计算机实际理解语言仍然是我们目前面临的最大挑战之一。在有关汽车的语境中,Google知道 “GM”指的是通用汽车,在其他情况下,比如有关食品的语境中,GM就会变成“转基因(Genetically Modified)”。但遇到那些有多重意思的词语呢?当你想改变(change)笔记本电脑屏幕的亮度时,实际上是想“调节(adjust)”亮 度,Google能理解到这一点;同理,如果你想把一份PDF文件转变(change)成一份Word文件,Google则可以帮助你了解如何“转化 (convert)”那份文件。
这些听起来也许像是简单的直接替换,但你要知道,计算机并不能像人类一样思考。给计算机编定程序,从词汇与语境中引申出意义,这在大约20年前几乎是无法想象的——回到那个时候,如果我们说希望能用这种方法处理世界上所有的语言会怎样?我们一定会被人当成疯子的。
未来:没有搜索的搜索
毫无疑问,我们已经走过了很长一段路。不过,当你追求完美的时候,不管你已经走了多远,也不管你解决了多少看似无法解决的难题,总是还会有许多 工作要完成。在我的心目中,搜索技术的“圣杯”就是要了解用户的想法,不仅仅是匹配词汇,而是要实际匹配含义。更理想的状态是什么?那就是在用户进行搜索 之前就已经完成了这项工作。
在我的梦想中,未来的搜索引擎能全天候地帮助并指导我,告诉我下一步该做什么。它知道我的下一场会议是在市中心,但它同时还能看到那个地区正在 断电,让我知道自己或许应该重新安排时间;它会提醒我两周后就到我老婆的生日了,同时提示我她想要一个iPad,再建议我去跟我朋友Matt交流一下,因 为他曾经做过iPad WiFi功能方面的研究,然后再把离我最近的苹果专卖店的路线图发给我……