技术开发 频道

SAP TechEd:魏涵思展示HANA特色功能

  【IT168 专稿】2012 SAP全球技术研发者大会于12月4日-5日在上海国际会议中心隆重举行。本届大会囊括应用生命周期管理、移动应用、企业信息管理及数据存储等八大类经典主题,以及今年增设的“价值实现”系列课程和“用户体验”互动展区,使SAP TechEd讲座及实践操作总数一举飙升至近100场,总时长超过200小时。在密集度和时长上均刷新历史记录,使参会者在短短两天内集中获取高含金量的技术经验。

  作为SAP全球较高级别的技术培训大会,今年的SAP全球技术研发者大会的主题为“创新—超越空前”,围绕相关主题,SAP将提供近100小时的实践操作课程和演示讲座培训,并首度将SAP的革新产品、未来大数据的处理平台——SAP HANA,贯穿在所有9个大类的演讲课题中SAP将借由TechEd,将其在内存计算、商务分析、移动商务、云计算和数据库等领域的最新研发成果,通过自身研发团队零距离地传授给中国的生态圈成员,助力SAP客户、潜在客户、合作伙伴乃至整个商业体系把握大数据时代瞬间商机,实现更大突破,继而助力中国企业的发展及全球化进程。

魏涵思演示SAP HANA
▲点击进入IT168直播专题

  在12月4日上午的主题演讲中,SAP HANA 技术中心副总裁魏涵思在现场演示了SAP HANA如何快速处理非结构化数据、Sybase和HANA的数据库如何无缝连接以及SAP HANA平台上开发应用的过程。

  企业中非结构化数据的比例越来越高,用传统方式处理效果并不好。魏涵思以互联网的视频数据为例,现场演示了SAP HANA如何处理非结构化数据。以“SAP HANA”作为关键词进行搜索,可以对视频中发言人的情绪进行分析。这源于HANA内置的自然语言能力处理,能够提取产品名称、情绪,对提取到的数据进行分析。

魏涵思演示SAP HANA
▲SAP HANA 技术中心副总裁魏涵思

  关于企业中的历史数据如何处理,魏涵思表示,这需要一个统一的数据平台,在SAP的角度来看就是SAP HANA与Sybase的结合。SAP HANA可以与SybaseASE、SybaseIQ和SybaseESP等数据库结合,并进行无缝的不中断的操作。通过现场演示,Sybase ESP和SAP HANA结合,每秒钟可以处理几万个事件并且在实时的事件流之上执行业务逻辑。从演示中还可以看出SAP HANA可以把非SAP的数据和SAP的数据很好地结合在一起。

魏涵思演示SAP HANA
▲魏涵思演示Sybase和HANA的数据库如何无缝连接

  SAP HANA不仅仅是数据库,而是一个应用平台,开发人员可以基于HANA平台进行编程。魏涵思现场演示了一个Javascript开发的应用中函数编码修改的过程。魏涵思表示,除了Javascript,SAP还在开发一个新的语言:RDL。RDL更适合在SAP HANA平台上开发应用程序,并且更加便捷。

  据悉,SAP TechEd起源于美国,距今已有17年的举办历史,是SAP全球最重要的技术培训大会。今年的SAP TechEd在全球四大主要城市举办,分别为西班牙马德里、美国拉斯维加斯、印度班加罗尔和中国上海。

  SAP 全球技术研发者大会将SAP生态圈的成员汇聚在一起,交流技术信息,探讨IT诀窍。在这一技术培训的盛会上,IT经理、管理员、业务分析人员、项目经理和软件开发人员汇集一堂,探寻业务革新上的最新动态。2007年,SAP TechEd成功登陆中国,并已先后在上海和北京成功举办五年。2011年,超过2500人在北京参与了这项技术盛会,亲身体验了SAP生态系统在中国创建的广阔交流平台。

${PageNumber}

  以下为演讲内容:

  我想跟大家再多说两句,我们看到,现在有很多非常多的非结构性的数据,比如说每秒钟都有60小时的视频数据上传到网上,这些都是非结构化数据,而且对于商业和企业来讲又是非常重要的数据,我们不能够忽略这样的数据源。我们也可以跟大家讲一讲,HANA怎么样能够对视频进行分析。

  魏涵思:在互联网上有很多的视频网站。它们是可以用SAP HANA来进行分析的。但我们没有办法提取这些视频当中的数据,我们只能够进行搜索。

  如果我们能够从视频中看看发言人在讲一些什么,然后提取这样的重要信息那么将会更好。

  我们提取了HANA的这些视频而与此同时也提取了视频中人所说的一些文字,增加了一些结构化的信息,比如说时间信息等等,并且也用于HANA的内在的一些自然语言处理的能力,然后提取一些包括名称的实体结构,还有产品名称等等。

  下面可以给大家展示一下这边也有SAP HANA这个词的。所以说我们这边所有包括SAP HANA出现的这些视频都出现了。

  此外,还可以进行一个情绪的分析,也就是说发言人在想和说这个产品的时候,他的一个情绪。比如说他是乐观的,还是悲观的,还是肯定的,还是否定的,这也就是一个情绪的分析。

  此外,我们可以看哪些对HANA是非常肯定的,然后就会发现,这边有一个中文的视频。HANA也有自己内置的自然语言的处理能力,包括30多种语言,其中自然也包括中文。

  我们也看到这边有一个中文的视频。

  (视频)

  画中音:我们基本上实现了当初三个目标,第一个快速的报表展现,同样一张报表,同样到HANA里面拷一下,结果HANA 里面的速度比Oracle里面的速度快200到300,这是150多张报表平均测试下来的结果。这是非常非常惊人的数据。

  这样的视频大家看到了非结构化的数据,也可以进行一个分析,而且HANA内置自然语言能力处理也能够帮我们提取这样一些产品名称,并且提取情绪,并且对情绪进行分析。

  那些想知道视频内容的人也可以对于视频进行分析了。

  Stenfan:有些人就过来跟我讲,你怎么能谈大数据和内存这样一个问题,因为这两个本身是相互矛盾的。

  但是我觉得我们HANA这边是有1PB的数据量性能标杆。参加发布在Saphana.com上的1Pb数据量性能标杆白皮书。

  我们有10节点,100TB内存,与此同时又10年的分销历史数据,1.2万亿条的记录。(每天3亿3千万笔交易/天)

  HANA有非常好的压缩逻辑在,我们也对未来做好了很好的准备。因为这些数据,你不能够只是扔到文件夹里面,需要对它进行处理,进行分析。

  而且得到一些实际的意义,得出一些结论,所以必须要对它进行分析,这就是HANA的功能。

  另外还有一个问题,也就是说,这么大量的数据,对你来讲,对你的结构来讲有什么样的意义?我先建议大家考虑一下你未来会有什么样的一个很大的数据。还有就是把你的网站上面的登录数据分析。

  还有就是你的产品相关的大量数据,如果你要分析人类的DNA的数据,实际上,都是有一个新兴产业在背后支撑,甚至可以提供这样有关人类DNA分析。

  此外,如果是公共事务行业的,你可能每天每分钟都会有这种就像能耗,能源表的数据,所有这些数据都是大量的数据。我建议大家考虑这样的一些大数据所带来的挑战,即便你现在没有庞大数据的挑战,你很快也会面临庞大数据给你带来的挑战。

  大家在这里可以看到非常多的数据,我们在这方面,可以做的多快,这个报告。所以现在我们已经有了这样的技术,让我们能够开发新的应用。因为就像我所说的,现在我们有着巨大的机会,一旦你有了数据进来,在数据基础之上我们就可以进行操作,比如说对于在线的零售商,他们有了这样的工具,就能够马上和登陆上网的用户来进行谈话。他们会跟顾客说,你如果想买这个,你可以看看这个商品,可能对你来说也会感兴趣。所以这是基于我们的顾客他的历史使用习惯,你也可以推荐什么东西对顾客来说可能更适合,你也可以告诉顾客,比如你在这里买这个商品我就可以免费运送,或者告诉他这种商品现在是免费送出的。

  只有在潜在的数据集,就是历史数据,得到一个及时的分析之后,你才能够做出这点。所以这一切的效果就是我们到最后会有一个统一的数据平台,我们的愿景,其实我们已经讲了很多次,就是要让你们的业务变成一个统一的数据平台,你们会把你们的数据放在这个平台上而只需要放一次,然后不同的应用,可以基于这样的数据平台,发挥作用。就像ERP一样,它是一次性的安装,然后比如说CRM,我们可以在这个平台的基础上,做很多事务处理,预测、分析,所以在同一个数据集上,数据平台上我们可以做这么多的事情,我们做的不仅仅希望产生不同的新的应用,与此同时我们也希望摆脱复杂性,我们希望能够获得一个非常全能的系统,在这个系统之上,我们有几百种,上千种的应用。

  所以我们有了HANA之后,觉得有了一个巨大的力量,能够把整个这一切的业务的成本降下来,把它的复杂性降低下来,然后把整个平台的能力,提升一步。这样我们怎么样去做到这点呢?就是把Sybase和HANA结合在一起。

  不管是SybaseASE SybaseIQ SybaseESP,所有这些都将结合在一起,然后进行无缝的不中断的操作,没有任何一个客户被我们遗忘,没有任何一个IQ客户被落下来,没有任何CRM的客户落下来,所有的人都可以使用这个系统,从今天开始我们就会引领大家,然后追随着我们的路线图,达到统一数据平台的目标。

  在这里举一个例子看看Sybase和HANA的数据库可以怎样无缝联结在一起。

  魏涵思:有了SAP Sybase ESP,再结合HANA我们每秒钟可以处理几百万个事件,这里是一个HTLM5为基础的一个监控的应用,主要应用ESP,这一切都基于HANA的平台在这个应用中,我们可以监控事件的吞吐量,当然是在我们的商业的累计它的基础之上,这个商业逻辑是应用于我们的事件流上,HTLM5的应用,是在一个PPT的浏览器控件中展现监控的应用是加载在Sybase Event Stream Processor上面,现在出现无数个没有身份识别手机定位的信息,在这里,通过这个监控应用,可以看到ESP的立证,现在每秒钟获得两百万个事件。所有这些都是系统中实时发生的,不是我们假照的数据,业务数据的逻辑,是一个筛选器,是一个过滤器,它把进入的信息,当中非定位的信息都剔除出去,现在我们有两种数据,一种是有GPS的信息,定位信息的手机信息,另外一个数据没有什么定位信息,没有详细的定位信息的一些数据,它只是一些手机的蜂窝的识别符,我们可以使用一个映射表来对每个蜂窝的ID进行预定义定位信息的加入。然后我们再把这两种信息加在一起然后在HANA上进行运行。

  你可以看到现在没秒钟有两万个事件的流量,我们也可以很快看看映射表。它可以对一个手机的蜂窝名来施加,或者在这上面附着一些预定义的定位信息,通过这个来看到,通过Sybase ESP和SAP HANA的结合,一秒钟可以处理几万个事件而且在实时的事件流之上执行一些业务逻辑。晚些看看对于这些数据做一些什么样的进一步的处理。

  Stenfan:大家看到这也是一个非常好的例子,可以展现出HANA的另外一个作用,也就是我们可以把非SAP的数据和SAP的数据很好地结合在一起。所以你看到,有些数据来自于手机、汽车或者股票的数据,把这些数据都纳入到HANA当中,如果这是一个数据流、事件流我们就可以把它纳入进来。按照这样的方式,可以对它进行进一步分析。与此同时,我们也不断地发展着HANA的这个平台,现在它不仅仅是一个数据库,它现在已经成为一个应用平台,这就意味着,我们可以在HANA当中进行编程。为什么要做这点呢?如果你看我们业务应用40年,在这四十年中我们学到了很多数据库应该做到什么,我们学到了很多,比如说突然间我们意识到这个操作可以通过数据库来做,这样就不需要再把数据库中很多数据把它运输到或者转到应用层。很多事情可以直接在数据库层做出来。

  现在我们要做一个现代的管理,有现代管理能力的数据库。我们觉得现在现代的数据库,它应该不仅仅只认得比如说一种货币是什么货币,它也要知道这种货币,怎么样去做转换,就基于数据库一些既有的数据,同时我们也要让数据库识别数据的层级,同时在数据库当中也有一定的复杂性。它能够处理这种层级的关系,然后我们可以问HANA给我一个层级结构,在这个层级结构之上我又可以做什么?做整合,数据库我们希望也能够帮助我们做到这点。同时也希望数据库知道怎么样处理库存。

  大家都知道,以前的数据库只是简单地记录一些库存的数据,我们也希望数据库知道怎么样去处理库存,比如说在不同时间间库存的处理。还有各个时间间的关系。调度,等等。为什么要达到这点?因为这一切将会给我们的开发者得到无穷的便利,到最后很多应用的开发者把很多可以交给数据库,不同的数据层之间,到最后可以实时地就调用出我们最需要的数据,而且是快速的应用这样的一个效果。非常迅捷地调出我们所要的数据。希望到最后,我们的这个数据库非常的迅捷。到最后,这一切会使我们开发的过程更加便捷更加方便。

  下面一个演示。

  魏涵思:现在仔细来看看HTLM5为基础的监控的应用。

  这是刚刚给大家展示的一个应用。这个应用直接在HANA的原生的平台上进行运行,这个应用的后端部分,Javascript所开发的,这里是我们应用的编码。它是使用HTTP的要求,从ESP当中获取统计数据的函数,现在看到编码,我们来对它进行一些变化。

  如果你看监控应用,大家可以看到,这个事件流的吞吐量非常大,而且这些数据没有格式化,现在我们做一些格式化,非常形符我们已经准备了一个函数是Cond的函数,对它取消批数,做一个转换,现在又把原文件发回了HANA,然后它被存起来之后就提交,激活,大家再来看看我们的这个数字已经变了,已经格式化了,看上去好多了,所以可以看到在Javascript的支持下,我们现在可以实时对这些数据来进行一个变化。

  除了Javascript,我们现在在开发一个新的语言是RDL。这个语言最最适合来在HANA上建立强有力的生物应用,而且是用非常容易的方式去打造,这个演示中我们可以看到,在HANA的平台之上,你也可以建多么强有力的,你可以使用Javascript或者其他的语言,很快也可以使用RDL的语言了。

  Stenfan:所以用HANA做一个编程的环境也是非常有趣的应用。随着时间推移,我们将会拭目以待看看有什么样新的编程的方式出现,这需要大家和我们一起合作,开发出一些新的非常有趣的实践。

  现在来看看你们的系统,你们的生产系统,你们的作业系统,看看你的痛苦点是哪里?你们希望改善的是什么?你们的限制现在在哪里?

  比如说可用性,或者定价引擎,你们的痛苦点,你们所问的这些问题,我们来看看这些问题之上,我们怎样共同创新,首先当然要了解你们想要的是什么?你们想要解决的问题是什么?你们想要的商机又是什么?然后了解了你们的需求之后,我们将会再问自己,HANA是不是能够帮助你们解决潜在的问题?

  现在,我们想说HANA它能够给很多的问题提供潜在的解决方案。让我们进行共同创新,但首先共同创新之前,我们一定要有一个商业的理由,然后也要做好可行性的分析。

  首先我们问这个问题,挑战在哪里?但到这之后,我们准备了共同创新之后,首先要创建这些条件,共同创新的条件。现在在欧洲,以后在中国我们也将会和很多大学一道合作,我们将会招募最好的人才跟我们一起合作,应对所面对的挑战,大家共同面对所面对的挑战,因为到最后人是最重要的,是人创造了软件,设计了软件;是人在跟我们一道合作;是人在面对无穷的挑战。所以我们工作的方式就是善用人的智慧,特别比如说一些大学、学术机构的人员的智慧来帮助我们解决共同面临的挑战。我们将会用我们自己的专长,比如说我们所有的基础架构我们的技术一道进行合作。到最后我们希望打造的平台是能够支持全新非常完整的,非常强大的生态体系。

  现在我们和大学还有一些客户一道合作的一个项目,就是这个业务的地理空间的一个方面,一个解决方案。我想说在这方面,我们很长时间,都忽视它了,所以我们必须要从现在,对它加以重视,以前我们非常关注客户、产品,但我们一直都忽视了地点定位这种应用,这个因素。现在我们正在致力于这样一个项目。也就是我们所谓的地理空间项目。

  当然这不是HANA的DNA,HANA的DNA是基于所有的原生的数据。当然,随着原生的数据,它有很多很多地理空间方面的信息,我希望能够使用这样的信息,来做到更好地可视化,然后基于它来去开发更多的应用实用的AP。看看这个系统中我们可以做到什么?

  魏涵思:大家可以看到这是一副地图,其中上面有500万个兴趣点,可以看到它可以汇聚成几个泡泡,主要是基于它的位置来进行汇聚的,这个兴趣点可能是一个餐馆或者学校,也有可能是幼儿园,或者是医院,我们放大一下,可以看到这些集群进行即时的计算而得出,在这张图上,左边可以看到聚合信息是围绕着兴趣点来产生。

  我们的计算规则包括类型和国家,这边再往深处拉,可以看到,HANA可以进行即时的计算,在多边形里面,可以找到兴趣点,然后同时即时地对聚合信息进行调整,HANA计算速度非常快,我只要调整一下多边形的形状就可以看到聚合信息也随之进行相应地调整。

  可以看一下点击这里,我现在点击的就是英格兰,你可以看到马上就跳出来了。所以这里看到一个超快的地理空间的分析,而我们所计算的基础,完全是静态的数据。但是也看到全都是实时的数据。大家还记得第一个演示吗?在第一个演示中,把Sybase的事件流处理即时力进行了分析,在那个例子中,我们用了一些匿名的手机定位数据,现在可以用这个实时的事件流的数据,可以把兴趣点的数据进行放大,可以放大到德国的一个小镇,这个小镇就是在SAP总部奋进,这是一个热图,这个热图就是根据这一地区所使用手机的数据计算出来,可以看到有很多人从不同的方向驶上高速公路,都往这个小镇开去,我们看看这是什么样的情况?现在在这个小镇里面有德国非常著名的组成俱乐部,大家都在去组成俱乐部去看比赛,左边是总数是显示了多边形数据终所有手机数据信息,大家可以在展示中看到SAP HANA的惊人的速度,现在还在进一步开发中,这个引擎可以用直接实时的数据来进行运行,而不需要使用聚合信息等其他的结构性的信息。

  这样可以帮助我门打开全新的应用。可以更加充分地利用地理空间的信息。

  Stenfan:非常感谢,我想大家在想,这对我们的业务而言可以带来什么样的意义呢?

  比如说你们是一个零售公司,或者是你有一些销售大区,通过这个应用的话,你就可以对各个地区的信息进行实时的分析。而且是即时的分析,太惊人了。

  我很快地总结一下。

  我希望大家在今天听了介绍之后记住三点。

  第一,HANA是非常适合于交易和报告相结合的应用负载。它把事务数据、分析数据、结构性数据,非结构性数据,视频数据,地理信息数据都完美地结合在一起。它也是非常适合您的企业经营背景完美的一个平台。而且它有很好的能力,帮助我们改变IT的精细地运行,并且降低成本。

  HANA和Sybase系列是完美地融合在一起,他们的结合提供了一个全新的架构。实现强强联合,提供一个统一的服务器平台。这样的话,我们就不需要有一堆的服务器。因为我们通过这两个系列完美的集合有一个统一的数据平台,来帮助您继续进行持续创新,而不会中断任何业务系统和数据。HANA和Sybase系列产品完美集合提供统一的数据平台。

  另外HANA结合了XS、JS和RDL/RDE提供了最具有创新性的应用平台。这也是我们业内首次把数据库处理和应用处理,体现了完美的融合。而且服务器角度也可以实现无缝连接。在架构上只要用这么一个服务器就可以。这样就意味着为我们的客户创造更多的价值,当然这只是一个起步,我相信在未来,通过我们共同合作,我们一定能够打造出更加有意义的,对我们业务能够有推动力的应用。谢谢!

0
相关文章