【IT168评论】2012年4月13日第三届“数据库技术大会”将在永泰福朋·喜来登酒店·北京召开,本次大会是IT168、ITPUB、IXPUB、ChinaUnix联合主办。IT168数据库技术大会已经成功了举办了两届,本次是第三届,盛况空前,将有超过900位技术专家和技术爱好者前来参会。本次大会上,NoSQL是一个技术的亮点,不仅技术演讲者资历深厚,主持嘉宾同样是业界的顶尖高手。再次提醒大家的是,NoSQL数据是在专场9。
今年的数据库大会增加了"微博上墙"赠书活动,只要您的内容推送到在我们的微博大屏幕上,就有机会领取50本限量图书,具体参与方式当天揭晓。
一、NoSQL数据库简述
说到数据库,大家不得不关注NoSQL,可以说现在NoSQL是当今非关系型数据库的宠儿。在这里我们先从NoSQL的基础知识给大家做一些简单的普及。
NoSQL(NoSQL = Not Only SQL ),意即反SQL运动,是一项全新的数据库革命性运动,早期就有人提出,发展至2009年趋势越发高涨。NoSQL的拥护者们提倡运用非关系型的数据存储,相对于目前铺天盖地的关系型数据库运用,这一概念无疑是一种全新的思维的注入。
现今的计算机体系结构在数据存储方面要求具备庞大的水平扩展性,而NoSQL致力于改变这一现状。目前Google的 BigTable 和Amazon 的Dynamo使用的就是NoSQL型数据库。
NoSQL项目的名字上看不出什么相同之处,但是,它们通常在某些方面相同:它们可以处理超大量的数据。
这场革命目前仍然需要等待。的确,NoSQL对大型企业来说还不是主流,但是,一两年之后很可能就会变个样子。在NoSQL运动的最新一次聚会中,来自世界各地的150人挤满了CBS Interactive的一间会议室。分享他们如何推翻缓慢而昂贵的关系数据库的暴政,怎样使用更有效和更便宜的方法来管理数据。
“关系型数据库给你强加了太多东西。它们要你强行修改对象数据,以满足RDBMS (relational database management system,关系型数据库管理系统)的需要,”在NoSQL拥护者们看来,基于NoSQL的替代方案“只是给你所需要的”。
NoSQL 是非关系型数据存储的广义定义。它打破了长久以来关系型数据库与ACID理论大一统的局面。NoSQL 数据存储不需要固定的表结构,通常也不存在连接操作。在大数据存取上具备关系型数据库无法比拟的性能优势。该术语在 2009 年初得到了广泛认同。
当今的应用体系结构需要数据存储在横向伸缩性上能够满足需求。而 NoSQL 存储就是为了实现这个需求。Google 的BigTable与Amazon的Dynamo是非常成功的商业 NoSQL 实现。一些开源的 NoSQL 体系,如Facebook 的Cassandra, Apache 的HBase,也得到了广泛认同。从这些NoSQL项目的名字上看不出什么相同之处:Hadoop、Voldemort、Dynomite,还有其它很多。
NoSQL与关系型数据库设计理念比较
关系型数据库中的表都是存储一些格式化的数据结构,每个元组字段的组成都一样,即使不是每个元组都需要所有的字段,但数据库会为每个元组分配所有的字段,这样的结构可以便于表与表之间进行连接等操作,但从另一个角度来说它也是关系型数据库性能瓶颈的一个因素。而非关系型数据库以键值对存储,它的结构不固定,每一个元组可以有不一样的字段,每个元组可以根据需要增加一些自己的键值对,这样就不会局限于固定的结构,可以减少一些时间和空间的开销。
二、大会演讲主题
本次数据库技术大会上,我们邀请了业界知名的NoSQL技术专家给大家分享他们在NoSQL数据库应用方面的技术和技巧。
主持嘉宾:杨海潮:新浪首席DBA
新浪首席DBA,在大规模高并发,海量访问有丰富的管理经验。热衷于数据库设计,性能优化,分布式部署方案和高可用性方面的研究。
之前从事大访问量网站的部署以及优化工作,加入新浪后主要负责整个公司的数据库管理工作。
演讲主题一:新浪微博:Redis的大数据之路
Redis是一个基于内存的 kv 存储,从 rdb 到 aof,再到已经被废弃了的 vm,Redis 的持久化之路一直走的很坎坷。持久化方案不完美,不支持冷热数据分离,也就意味着 Redis 在面对数据量持续增长的时候,总体拥有成本(TCO)也随之线性增长。
新浪微博从 2010 年底开始引入 Redis,各项业务指标在经历了 2011 年全年的疯狂增长之后,在很多场合,越来越大的数据量,使得用 Redis 做存储的方案的成本越来越高,为了在保持性能的前提下降低成本,我们做了一些新的尝试,在这里跟大家一起分享一下。
演讲嘉宾:唐福林:新浪微博开放平台资深工程师
唐福林:新浪微博开放平台资深工程师,目前负责新浪微博开放平台底层性能优化,曾负责 t.cn 短链,微博用户关系,计数器等底层服务。曾负责过包括新浪邮箱全文搜索在内的多个基于 Lucene 的垂直搜索引擎开发,以及新浪爱问和新浪播客的运维。对承载大数据量、高并发的互联网基础设施建设有丰富的经验。
新浪微博:技术团队简介
新浪微博开放平台,平台研发团队,负责微博底层功能实现及性能优化。 这里有亿万的用户,这里有方舟子和韩寒,这里有一切热点事件和争论。围观改变中国,这里是新浪微博。这里有 @timyang 大牛掌舵,这里有海量数据,这里有变态的并发,这里有技术Geek们需要的一切。微博开放平台,我们呼唤更多同行加 入!
演讲主题二:华为实践:电信行业的NoSQL技术探索
话题背景:电信领域的数据,历史上一直是计费、账务、网络日志类型的数据为主,当前正处于移动互联网、物连网蓬勃发展的时期,数据的爆炸式增长,传统的关系数据库,已经不能满足海量数据运营和管理需求,如何把数据分布管理就是成为研究的重点。
NoSQL是一个分布式的、面向海量数据管理的数据库系统,在互连网的海量数据管理上,有很好的表现,因此,我们主要对NoSQL在电信领域的应用展开探索,本次议题主要讨论我们碰到的问题和一些方案尝试。
演讲嘉宾:刘成华:华为数据库能力中心高级工程师
刘成华:华为数据库能力中心高级工程师,构件开发部技术负责人,负责华为自研数据库的架构设计和开发,支持解决方案对商用数据库的产品选型。在内存数据库、NoSQL数据库的设计开发上有多年的积累,精通Oracle/DB2的企业级应用。加盟华为前,任创我科技技术总监,为电信运营商提供BI及其数据仓库解决方案。
演讲主题三:腾讯自主开发NoSQL平台应用实践
随着web2。0的快速发展,对互联网业务数据的要求越来越高,高可用、大吞吐、低延迟、数据安全性高等挑战,并且业务的低峰时段越来越短,对存储的扩容、停机调整时间很难接受,对平滑扩容、故障自动切换的要求也随着而来。
本主题介绍腾讯如何使用自研NoSQL系统CMEM,从而应对并解决这些矛盾。本次主题,详细介绍CMEM系统模型和设计思路、系统优势功能的原理、实现方式等。
演讲嘉宾:邹润谋:腾讯资深DBA
邹润谋:腾讯资深DBA,具有大量高可用,海量数据库的规划设计及运维经验。现主要负责腾讯开放平台数据层,以及内部NoSQL数据存储的运维管理工作。参与各类数据存储方案(CMEM、CDB)的设计,评审,实施和运维工作。