【IT168 现场报道】2013年4月18-20日,第四届中国数据库技术大会(DTCC 2013)在北京福朋喜来登酒店拉开序幕。在为期三天的会议中,大会将围绕大数据应用、数据架构、数据管理(数据治理)、传统数据库软件等技术领域展开深入探讨,并将邀请一批国内顶尖的技术专家来进行分享。本届大会将在保留数据库软件应用实践这一传统主题的基础上,向大数据、数据结构、数据治理与分析、商业智能等领域进行拓展,以满足于广大从业人士和行业用户的迫切需要。
自2010年以来,国内领先的IT专业网站IT168联合旗下ITPUB、ChinaUnix技术社区已经连续举办了三届数据库技术大会,每届大会超过千人规模,云集了国内技术水平最高的数据架构师、DBA、数据库开发工程师、研发总监、IT经理等,是目前国内最受欢迎的数据库技术盛会。
▲点击进入第四届中国数据库技术大会(DTCC 2013)报道专题
在第一天下午的内存数据库专场中,SAP研究院技术创新平台创智革新团队高级研发经理董玢发表主题演讲《SAP HANA深度剖析》,深入介绍SAP HANA创新内存数据库技术,并通过案例分析SAP HANA如何解决大数据难题。
董玢05年加入SAP,一直致力于商务职能和数据集成领域的工作。加入SAP之前,任职于德国海德堡大学.本科毕业于北京邮电大学,后获得德国乌尔姆大学计算机硕士学位。据董玢介绍,SAP HANA是一种革命性的内存平台,它简化并合理化了复杂和昂贵的IT体系结构。SAP HANA帮助大量数据,并以前所未有的速度提供信息,比以前快了1万倍。SAP HANA是一个开放平台:适应性和可扩展性,使能够创建之前无法设想的应用程序,并重新思考和设想新的方法来运行业务。
谈到列式和行式存储,董玢表示,数据库通常使用行式存储,SAP HANA 也支持行式存储,但是它是为列式存储而优化的。传统数据库使用“物化聚合” (记录min/max/sum/avg…) 来增加分析性能,这些聚合记录在数据更改时必须被重新计算,HANA可以高性能的实时计算聚合,无须聚合表,这可以简化数据模型,保证及时性,并且减少日志记录。
据介绍,SAP建模视图包括三种类型,一是属性视图Attribute View:是基于不同数据库源表中具有一定关系的属性数据而建立起的实体模型。二是分析视图 Analytic View:用来建立包含度量数据的模型。三是计算视图Calculation View:可以针对数据库中定义进行更高级的计算,其可以包括计算逻辑的层次概念。
谈到Hadoop能否取代数据仓库,董玢表示,Hadoop不是一个数据库;高延迟,非实时访问的系统,不适合大量的小文件存储;HDFS的设计思路重点在于“一次写入,多次读取”,不支持多人同时写入与任意位置修改,延迟优化重点在于整个数据集获取而非随机查询的单条数据;其主要是为海量数据处理进行优化;MapReduce适应于一次性写入的整体数据集批处理;没有SQL接口;缺乏广泛的BI工具的支持。
SAP HANA有三个典型应用:一是将SAP HANA作为高性能的决策支持平台,对企业的所有其他数据源提供支持,即刻响应、无等待、无延迟的数据传输,与BW一起为企业提供不同的应用服务(例如:替换某些中BW由于海量数据而无法计算的应用);二是作为SAP应用加速器,SAP HR中由于数据量的关系,而无法提升效率的分析应用,在SAP HANA中已经有现成的解决方案(例如:SAP Business Suite Accelerator);三是HANA作为一个预测分析的平台 性能的大幅提升是新的企业创新应用的基石, 企业可以基于SAP HANA开发新的应用,比如基于数据挖掘和实时预测分析。