技术开发 频道

英特尔CTO贾斯汀谈未来三个大趋势

  趋势三:搜索数据社会

  很多人,很多的媒体朋友在访问的时候都会问到一个问题,我们对于信息时代结束之后接下来会进入什么样的时代呢?提到信息技术好像是青少年跟成人的阶段,我往往回答的是我们会进入所谓的数据社会。什么是数据社会呢?可能大家都搞不清楚这到底指的是什么。

  首先所谓的数据社会并不是大数据的另外一个说法,当然大数据没有什么样的问题,可是我要告诉大家数据社会指的不仅仅是大数据而已。我们不是通过分析数据知道说我们应该买什么样的牙刷或者牙膏,这不是我们的目标,在一个数据社会里面我们相信真正的价值在于数据本身。假如我们能够截取这样的价值,不论是对一个人,还是对整个社会都会有很大的帮助。因此我们要有新的技术。

  怎么样能够打造数据社会,我们所需要的技术跟大部分人所联想到的大数据的技术是不一样的。昨天在柏安娜的主题演讲中有提到大数据,接下来请大家看一段视频,视频播放完毕之后我们会请英特尔这个领域的专家上台跟各位做进一步的说明。

  我们要邀请Ted Willke,他是我们首席工程师兼负责图形分析运营部门的总经理。在我们刚才提到的数据社会当中,你觉得怎么样让数据对我们有更大的帮助呢。

  Ted Willke:数据对我们当然有很大的帮助,比如说通过这些数据我们可以了解自己跟周边的环境有什么样的关联。大家都听过所谓的六度分隔,比如说你的同事的同事,你只要想到六个人的名字,你就可以跟世界上所有的人都能够扯上关系。换句话说,你只需要通过几个人的介绍,你就可能有机会认识一些名人。

  所以,我们希望通过分析数据能够发掘出这样的关系。等一下我会带你去跟我进行数据的探险,我们要去分析人际关系必须要通过图形分析。首先我们要去整理这些数据,我们要有一个清单,有一个表格或是一个树状图,我们要组织整理这个数据有一个方法,那就是把它变成图。所谓图是说电子计算表这样的图吗?不是。其实我的图是点代表数据,可是一张纸上有很多点,点与点之间有线,这个线就代表它们彼此之间的关联。就好像我们刚才看到的视频一样,其实互联网它就是很多图的结构的组合。我们人的大脑也很习惯处理图的结构。

  接下来什么叫做分析呢?

  所谓的分析就是资料采矿,这是几个月前Facebook宣布的一个大型的机器学习研究项目,等一下我们会做进一步的说明。英特尔现在在开发一些技术,让大家都能够通过我们的资料采矿更积极的找到他们需要的跟图有关的数据。

  贾斯汀:我们都知道一开始的分析技术像Hadoop,为什么我们不能利用这样的技术,为什么还要有新的分析工具?

  Ted Willke:当然你如果把数据加以切割,数据中心里头的每一台机器可以独立的去分析部分的数据那当然很好。可是假如我们提到这种人际关系,它是没有办法切割的,你没有办法把人际关系切割成一段一段,把不同的数据交给不同的机器进行分析,这样是不行的。可是这会牵扯到性能的问题,存储设备的问题。我们每个人都跟很多人有关系,假如利用MapReduce进行分析,你没有办法完整的分析出每个人完整的人际关系。因此我们要把所有相关的信息放在一台机器里面来进行分析,这可能牵扯到很多的数据,而且我们要复制信息。比如一个人我们可能有时候到北京,有时候到上海,我们要分析这个人的人际关系有一台机器必须要负责研究北京,另外一个要负责研究上海。所以,过去的这种MapReduce的方法是行不通的。

  丹尼是我们公司的一个科学家,他来帮我们做一些演示。你现在到你最喜欢的餐厅用餐,你看到很有名的喜剧演员赵本山,跟他一起用餐的是退休的篮球巨星迈克尔乔丹。你想成为喜剧演员,当然希望认识赵本山,这个时候你通过云系统想要去看看你是不是能够跟赵本山扯上任何的关系。所以我们有一个搜寻的工具,这当中我们把 所有用户创建的百科里面的400万个资料摆进去。我们的后台正在进行实时的分析,分析的结果就可以把它制作成我们刚才提到的图。没有错,我们实时的在分析400万比百科的数据和资料,我们分析到底哪些资料是跟赵本山是有关的。我们知道他是一个电影导演,也是一个喜剧演员,同样的我们可以针对迈克尔乔丹做同样的动作。来看看迈克尔乔丹跟赵本山之间是不是有共同点,这里出现了很多不同的类别。这就是这两个名人之间的共同点,这些共同点可能是大家都想不到的。我知道迈克尔乔丹是个运动员,也很喜欢打高尔夫球。

  贾斯汀:感觉上好像他们没有共同的兴趣,这个时候该怎么办。

  Ted Willke:接下来还有一个很重要的问题,我们会问迈克尔乔丹跟赵本山到底有什么样的关联。是不是可以通过我们的分析工具找到他们之间到底有什么样的关联。不要忘了我们的后台有一台机器正在跑,我们实时的在分析到底赵本山跟迈克尔乔丹之间有什么样的关系,为什么他们会在餐厅吃饭,迈克尔乔丹他是芝加哥公牛队的成员,教练是卡尔路易斯。可是卡尔路易斯他认识中国奥运代表队的选手,中国奥运代表队的选手又认识赵本山。所以,实际上他们只需要通过两个中间人就可以扯上关系了。我们公司里面有人认识中国的运动员,所以他可以帮你介绍。

  贾斯汀:这么大量的数据分析的这么快。

  Ted Willke:传统的数据库你要进行任何的查询,都必须分别建立一些索引。可是我们有图建构的研究项目,我们跟我们的伙伴合作,合作的项目就是机器学习。所以,我们现在可以很快速的进行数据的分析。我们传了短信给中国的运动员,问他有什么样的建议,结果他很快就回信了。他告诉我说原本想要认识赵本山的另外一个演员,他送了一个礼物给赵本山,赵本山很开心,他也提醒我们说要特别注意,你一定要知道赵本山到底喜欢吃饭,还是喜欢吃面,怎么办?我们根本不知道赵本山是喜欢吃饭还是吃面,也许可以通过图分析让我们来找到答案。所以,我们是不是可以通过图分析来知道赵本山喜欢什么样的礼物。

  有些时候很有意思,我们看到这样的图,我们看到有一条线,是金色的线。也就是到底迈克尔乔丹跟赵本山之间有什么样的关联,通过机器学习我们可以利用演算方法来预测赵本山到底喜欢什么。有没有看到这些不同的颜色,我们知道中间人有一些人是喜欢吃饭的,有一些人是喜欢吃面的,不过我们可以看这些人到底跟赵本山有什么关系,也许可以推断赵本山到底是喜欢吃饭还是吃面。

  Ted Willke:点击计算的键以后,我们的机器就会处理几百万比的资料,帮我们进行分析,他可能是喜欢吃面而不是喜欢吃饭,有86%的几率赵本山喜欢吃面而不是吃饭。

  贾斯汀:像我这样的数据探索者,您介绍的这种技术到底有什么样的意义呢?

  Ted Willke:当你要进行所谓的数据探索的时候,你可以通过英特尔所提供的这些分析工具,也就是我们的图分析工具,你可以更有效的分析生活相关的数据。因此,未来我们这项技术的发展绝对会有更大的突破。谢谢!

  总结

  我们一开始的时候问的问题是说我们可不可以建构未来,在计算的部分能够超越我们传统的建构的方式,我们的答案当然是“是”。Alan Kay就讲过,他说要洞察先机,来开创未来。你要预测未来,你不如去发明未来。他谈到有各种不同的可能性,但是我们可以通过发明来塑造我们的未来。

  我们怎么样构建未来,我们有什么样的过程。当然咬定改变人们对未来的憧憬,他们可能会很悲观,觉得未来有一些非常负面的可能性。我们如果说要塑造未来,就应该要改变一些我们的想法。很高兴今天早上跟大家宣布我们在中国有一个新的计划,也就是跟清华大学有一个明天的项目,这个合作是说我们要来思考未来,要来写、来谈到底我们希望有一个什么样的未来。

0
相关文章