技术开发 频道

NoSQL年度盘点:全力应对大数据来袭

  【IT168 专稿】如果给2011年的数据库领域贴上标签,“大数据”无疑是首选,它是继云计算之后IT界最热门的关键字。围绕大数据的存储和管理,NoSQL数据库渐入佳境,成为应对大数据挑战的主力军。2011年NoSQL数据库得到更多的关注和应用。不仅越来越多的互联网公司使用NoSQL,电信业以及其它传统IT行业也开始使用NoSQL。更值得一提的是传统关系型数据库厂商也加入了NoSQL的行列,迅速扩大了NoSQL的影响力。

  NoSQL应对大数据挑战

  随着互联网、电子商务和物联网的兴起,当今企业中,80%的数据是非结构化数据,且这一数据正在呈指数倍增长。据分析机构预测,到2020年,全球数据使用量预计将暴增44倍,达到35.2ZB(1ZB=10亿TB)。尤其是在互联网、电信、金融等行业,大数据趋势明显,数据在企业中发挥至关重要的作用。NoSQL数据库在此基础上诞生,并在2009年后得到空前发展。NoSQL技术能够使得企业用户更加高效地存储并分析海量数据,而这一点是传统关系型数据库面临的最大问题。

NoSQL应对大数据挑战

  虽说关系型数据库可能永远不会消亡,甚至短期内地位不会发生明显变化,但它们的发展受到架构、硬件环境的影响,并发读写慢、扩展困难、成本高成为传统关系型数据库通向大数据的道路上难以逾越的鸿沟。关系型数据库针对使用单核CPU系统、小容量内存、大容量硬盘的旧有硬件环境编写,而如今多核处理器和固态硬盘正在成为主流,硬盘访问已经不再重要。数据库的领军人物、Ingres数据库的主要设计者、目前担任VoltDB公司CTO一职的Michael Stonebraker对“陈旧”的关系型数据库提出了自己的观点。他认为关系型数据库是非常老的代码,是上世纪八十年代的东西,并且由于遗留问题,关系型数据库厂商无法对其进行改进。

  相比传统关系型数据库,有分析师认为,NoSQL数据库崛起的原因是数据作用域发生了改变,它们不再是整数和浮点等原始的数据类型,数据已经成为一个完整的文件。这对数据库技术提出了新的要求,它要求能够对数据库进行高并发读写、高效率存储和访问,要求数据库具有高可扩展性和高可用性,并具有较低成本。而NoSQL让数据库具备了非关系、可水平扩展、可分布和开源等特点,能够为非结构化数据提供支持。

  现阶段,NoSQL大多应用于互联网行业。目前国外的互联网公司如Google、Yahoo、Facebook、Twitter、Amazon都在大量使用NoSQL数据库。国内知名的互联网公司如新浪微博、淘宝网、优酷视频、中国移动飞信等都在使用NoSQL数据库,这其中不乏自行研发的产品,如淘宝网的OceanBase和Tair、豆瓣网的BeansDB等。(相关阅读:NoSQL数据库渐入佳境 国内应用案例盘点)

  传统数据库厂商加入NoSQL阵营

  在大数据和NoSQL如火如荼的时代,关系型数据库显得有些暗淡。有分析师认为关系型数据库将在没有任何人关注的情况下消失,如果Oracle、IBM、微软等传统数据库厂商不进行现代化升级,那么关系型数据库产品可能会被彻底重写。面对这样的局面,传统数据库厂商推陈出新,也开始加入NoSQL的阵营。这其中不得不提的是Oracle NoSQL数据库。

传统数据库厂商加入NoSQL阵营
▲Oracle NoSQL数据库

  Oracle NoSQL数据库,是在10月4号的甲骨文全球大全上发布的Big Data Appliance的关键组成产品之一,Big Data Appliance是一个集成了Hadoop、NoSQL数据库、Oracle数据库Hadoop适配器、Oracle数据库Hadoop装载器及R语言的系统。Oracle NoSQL数据库已于10月27日正式提供下载,据了解,Oracle NoSQL数据库将有两个版本,即开源版和商用版。使用开源版的Oracle NoSQL数据库将会大量节省企业数据库方面的开销。

  谈到Oracle发布NoSQL数据库的原因,分析师称这是其客户对于大数据的需求不断上升的结果。如果用户在其IT系统中已经使用了Oracle关系型数据库,那么在部署NoSQL数据库的时候就会面临这样一个问题,那就是如何与现有的数据库集成。Oracle自身的结合将是最好的解决方案。

  当然,传统数据库厂商的脚步从未停止,IBM随即回应了Oracle的NoSQL之举,IBM的副总裁兼数据库系统首席技术官Curt Cotner表示IBM将在明年推出内置NoSQL技术的DB2旗舰级数据库管理系统。IBM将NoSQL添加到传统关系型数据库中,在满足用户的需求基础上,让过渡过程变得更加平滑。IBM对开源产品进行修改,修改后的NoSQL功能在DB2数据库中运行速度比之前的开源产品快4倍以上,而且还消除了可用性以及可扩展性的问题。

  微软也在今年10月的PASS大会上,承诺在2011年年底前为其Windows Azure发布一个基于Hadoop的服务。Sybase企业数据库最新版本也将增强对LOB(Large Object)的支持,Sybase IQ新版本也将直接支持MapReduce。分析师表示这同关系型数据库模型发展过程极为相似,目前传统关系型数据库厂商都相继推出了NoSQL或者Hadoop服务,NoSQL技术的未来将一片光明。”

  NoSQL未来路在何方?

  大数据将NoSQL推上风口浪尖,但这一不太成熟的产品存在大量关键特性有待实现,仍面临诸多挑战。

NoSQL未来路在何方?

  首先,过度炒作。在大环境的影响下,越来越多的厂商声称拥有NoSQL技术、拥有解决大数据难题的能力。但实际上NoSQL并不是一种商业上的功能较多药,只适用于特定应用,不适用于所有场景。NoSQL技术在传统OLTP操作中没有什么用武之地。NoSQL的方向应该是数据分析。过度炒作反而不利于NoSQL的发展。

  其次,技术难度大。NoSQL的技术难度远远超过传统关系型数据库,目前能够掌握NoSQL技术的专业人员还是少数。NoSQL系统需要大量的技能来进行安装,以及需要大量的努力来进行维护。因此,企业在采用新的技术之前,应该确保他们拥有足够的人才储备。

  最后,支持力度小。大部分的NoSQL系统都是开源项目,没有能力提供全球的支持,没有足够的支持资源,或者没有类似于Oracle、IBM或者微软的信用。

  尽管NoSQL还存在很多不足,但趋势已然。据IDC预测,大数据处理将在2012年成为一项“必备”能力,明年将出现2.43 ZB (1ZB=10亿TB)的非结构化数据。2012年的NoSQL定会全力应对大数据挑战,成就指日可待。

0
相关文章