【IT168 现场报道】2016年5月12日-14日,第七届中国数据库技术大会(DTCC 2016)在北京国际会议中心拉开帷幕。作为国内数据库与大数据领域最大规模的技术盛宴,在为期三天的会议中,大会将围绕MySQL、NoSQL、Oracle、缓存技术、云端数据库、智能数据平台、大数据安全、数据治理、大数据和开源、大数据创业、大数据深度学习等领域的前瞻性热点话题与技术展开深入探讨,并邀请一大批国内顶尖的技术专家来进行分享,以满足广大从业人士和行业用户的迫切需要。
在12日下午的柏睿数据库技术专场,来自柏睿数据的高级数据工程师莫明勋、柏睿数据华东区总经理杜正浩、柏睿售前工程师牛和明为参会者带来关于流数据库在物联网时代应用及深度学习库与大数据统计方面的探讨...
“4V”解析大数据
在互联网和大数据时代,人类所有行为包括思想都会被记录下来并存储成数据,它是真实世界和虚拟世界之间的映射,构成了另一个世界。我们处在这个大数据的时代,那么什么是大数据呢? 莫明勋在演讲中从四个方面给我们解析了大数据的定义。
▲大数据定义图解
全球科技创新趋势正在发生巨变。大数据是人类社会的第一资源,对这一资源的有效利用和加工再生产,必将会对社会经济发展起到极大的推动作用,进而使人类可以更理性地分析世界、预知世界、应对未来。
快速学习 我们该怎么做?
在大数据时代下,莫明勋抛出问题我们该怎么去做,来抓住这个市场?他谈到一个方法:快速学习。这里所说的快速学习,并不是学生那样的通过传统的模式去学习,而是如何进行快速的整理数据。
机器学习就行一个真正的冠军一直迎头而上;模式识别一开始主要作为机器学习的代名词,而后正慢慢的没落的消忙;深度学习是一个崭新快速攀升的领域。
大数据平台的整体视图
另外,莫明勋还介绍了基于内存计算RapidsDB特点:全内存分布式数据库;高性能,高吞吐量,高扩展性;满足ACID数据库基本要求;支持标准SQL语句;实时数据加载;动态数据导出;高性能存储过程;高可用性;异地灾备,动态迁移。
流数据在物联网时代的应用
当今世界是一个信息化的世界,我们生活中无论是生活、工作、学习都离不开信息系统的支撑,因此,数据库的重要性毋庸置疑。随着云计算和大数据时代的到来,传统数据库面临前所未有的挑战,在性能和成本的双重压之下,数据库亟需寻找突破之路。一时间,针不同应用的各种新型数据库孕育而生,而敢于吃螃蟹的各个企业,也收获了不错的成效并积累了丰富的实战经验。
柏睿数据华东区总经理杜正浩在演讲中提到:工业4.0浪潮席卷全球,在工业4.0的每一个阶段,背后流淌的是数据!杜总用通俗易懂的方式解释了流数据的概念。接着提到流数据库,就是其数据可以是连续的无界的加入时间概念的数据流,对数据的处理具有时间限制的数据库系统。
*流数据:是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。广泛应用于传感器网络、生产制造、金融服务、航空航天、气象测控和网络监控等领域。
*流数据库:流式数据库系统就是其数据可以是连续的无界的加入时间概念的数据流,对数据的处理具有时间限制的数据库系统。系统的正确性不仅依赖于逻辑结果,还依赖于逻辑结果产生的时间。
RDP-国产化内存数据存储分析平台
开发一个分布式、纯内存化的大数据处理平台,帮助用户进行超高速的数据查询、分析及处理:
*基于MPP(Massively Parallel Processing)分布式架构,可水平扩展
*使用传统SQL作为数据访问接口
*提供一个SQL处理引擎能够处理复杂查询(如TPC-H, TPC-DS)
*该SQL处理引擎支持基于内存的数据存储单元;可以扩展成为一个联邦数据处理引擎,以支持不同类型、不同存储形式的数据源的统一数据处理。
在柏睿数据科技公司成立的1年时间内,先后推出了先后推出了Rpids Hadoop/ Rpids DB/ Rpids Stream 等RDP系列产品;与国内IT集成商曙光形成紧密战略合作关系,推出大数据处理一体机;国内著名集成商太极集团成为公司总代;与中科院、清华大学成立联合实验室,可见柏睿数据正努力成为中国最具规模的大数据实时处理平台提供商。
▲更多大会资讯,请查看大会专题:http://www.it168.com/redian/16DTCC/