提问者:我有两个问题,这个桌面搜索给用户提供信息方面Google有什么做法。第二个问题就是对数据更新之后,刚才您提到了如果用户仅仅是一些简单的大文件夹的操作,那么可能导致索引的一些更新,那么在这方面对索引更新方面,Google在未来有一些什么样新的技术的发展趋势?
王咏刚:您有两个问题,一个问题是关于桌面搜索如果对结果内容进行更好的组织,甚至包括一些语音化的分析,我想这不光是对桌面搜索有这种疑问,应该来讲不管是Google还是雅虎等等,我们都是对整个信息的处理,强有索引方式,我觉得是刚刚起步和刚刚发展的阶段,如何对信息进行深入的挖掘,比如说对同样一个词我们怎么样理解,对同样一句话理解到含义,那么这些东西我们实际上Google有非常庞大的技术力量在研究,这些研究应该说现在已经有一些很好的成果,我们在做一些相关的实验,而且在WEB搜索上可以看到相关的实验的结果。比如说有时候用户可以在WEB搜索上得到体验,我想桌面搜索会吸取这方面的成果。
第二个问题就是我们在索引更新的技术策略问题,实际上这是一个桌面搜索里面,我觉得对索引结构,得硬盘结构来讲非常重要的一个问题,它的索引来讲必须是适应这样一种,比如说有大批量的更新尽量,在非常快的时间,或者非常快的相应,这里面包括两个层面的意思,如果你的索引结构本身支持非常快的索引效率,比如说我们讲内部结构的话,它的更新是非常快的,它可以非常快的更新,另一方面如果你的更新需要很长时间,你能不能有一个很好的响应的方式。这两种技术实际上我们都是在桌面索引里面做了混合使用,具体的技术细节我们可以再讨论。
提问者:刚才想到一个问题,您说把桌面搜索和WEB搜索结合在一起,连接最多的结点WEB认为最靠前,如果把这两个混合在一起的话,如何排序,会不会WBE的搜索结果会淹没桌面搜索的结果。
王咏刚:很好的问题,我们现在的结果还没有达到您说的那种混合的,如果大家注意看,Google无论是中文搜索还是英文搜索,都有一个功能,叫做整合搜索,也就是说你会看到不同来源的搜索结果,这个结果会就标识,如果里面有Google桌面搜索信息,也会比较清楚的表明出来,而不是完全的没有界限的混合在一起,如何实现完全没有界限的混在一起,确实是一个挑战,就是您刚才讲的如何做一个混合的结果,那么现在大家知道这种算法,第一是根据相关度,也就是每一个结果的内容,第二是根据结果的重要程度,也就是这样一个结果页面,是不是在网络结果里面很重要,那么对于桌面搜索来讲也有相关度,但是计算方式不一样,这两种方式如果混合的话,要找一个加权的值,这说起来简单,做起来并不简单,我们正在研究。
提问者:如果这个文件被用户频繁使用,也就是说当前桌面环境当中,如果用户频繁使用这个文件的话,它的点击率,或者使用率最高,这个文件排序是不是应该靠前。
王咏刚:基本同意这一点,应该说这有很大的重要性,这个数学公式还需要推敲。
1