技术开发 频道

HBase:远落其他数据库之后

  【IT168 翻译】几年前,HBase看起来似乎可以成为大数据时代主导数据库之一。作为Hadoop的主要配对,HBase曾迅猛发展,但自从它趋于稳定,尤其是和NoSQL,MongoDB,Cassandra和Redis相比,远不及它们的普遍性高。

  这就很奇怪,鉴于hadoop在大数据平台的领先地位与受欢迎程度,为什么HBase未能跟着Hadoop流行呢?

  InfoWorld给出了这样的答案:“太难了。”虽然我和其他人预计HBase相比于其竞争对手MongoDB和Cassandra,其狭窄的使用范围和固有的复杂性会阻碍它的受欢迎程度,这也就让其他数据库摘得了大数据时代的桂冠。

  协会推广

  HBase其实有一个非常棒的开端。在2014年末,我认为Hadoop偏爱HBase,以及它能够“随着负载和性能需求的增加只是通过添加服务器节点就可以无限扩大规模,”将它作为三大数据库之一。现在发现我错了。

  根据DB-Engines,该引擎追踪了流行数据库的多个指标,HBase奋斗多年,终于跟上NoSQL的脚步与其同行。然而,早在2015年,HBase就开始下滑,尽管MongoDB和Cassandra一直在上升:

HBase:远落其他数据库之后

  一些人认为DB-Engines的排名可能会少算一个重要的指标:实际存储数据量。根据这个指标,伊万·利思提出,HBase和Cassandra或许会引领“新‘DBs’。”

  但简单地从数据存储有限适用性的角度来看,redis类似于HBase,这也表明有些事情要发生了,毕竟,Redis基本和HBase同时开始逐渐减少。这种双重下降的原因可能是与基本的工作负载都可以支持有关,MongoDB的Mat Keep告诉我:

HBase:远落其他数据库之后

  当然Keep有偏见,但他不是完全没有根据的。鉴于MongoDB的成功源于它能够支持广泛的运营工作负载,Keep确实指出了HBase的关键失败点。

  尽管马丁曾经宣称我们已进入“混合持久性的时代”,开发人员可以愉快地接受各种各样的工具来解决各种工作负载,实际上市场对这个 “长尾理论”的观点显然不是很宽容。

  前google员工(和当前亚马逊网络服务员工)Tim Bray说“不断扩大的基础知识是与开发人员必须保持相关的一个成本。”RedMonk分析师Stephen O’grady更进一步地说:“可能是我们正在接近一个好事多磨的阶段。在这种情况下,通常结果将是一个渐进的缓慢的分散之后逐步整合。”

  换句话说,细分数据存储让位给更普遍适用的数据库,可以满足更广泛的企业需求。

  除此之外,第二个原因是HBase真的很难使用。

  难以运行

  Server Density的CEO David Mytton说道,HBase是“难以部署和运行的。”另一位不愿透露姓名的业内人士更强调,认定HBase是“不可能运行的。”

  两年前InfoWorld的里克Grehan指出在集群和故障排除上HBase有固有的困难,更不用说一些困难的相关模式了。2016年,这些问题已经被处理取得了中等程度的成功,在很大程度上是因为改造成一个产品的不容易的事实。这使得HBase远比Cassandra更难集群,比MongoDB更不灵活。

  如果HBase不是对后台(分析)工作负载仅有相对狭窄的适用范围,这种复杂性将值得尽力改正,MongoDB的Henrik Ingo指出。事实上,据估计HBase的唯一真正的吸引力就是可扩展性和与Hadoop的集成,但大多数人不在Hadoop上处理工作负载。即使Cloudera的Justin Kestelyn倡导HBase,承认它比MongoDB其余的那些数据库有更多的“特点”。

  随着其他大数据技术出现了扩展或取代Hadoop,即使多用的NoSQL数据库已经越来越重要,HBase随着Hadoop上升的机会越来越少。HBase如果不发展一个可以承受更大空间的工作负载并且使其更容易使用,它就只能成为NoSQL一部分而不占据主导地位。

  原文链接:

  http://www.infoworld.com/article/3066358/analytics/hbase-the-database-big-data-left-behind.html

0
相关文章