【IT168 评论】虽然SQL数据库是非常有用的工具,但经历了15年的一支独秀之后垄断即将被打破。这只是时间问题:被迫使用关系数据库,但最终发现不能适应需求的情况不胜枚举。
但是NoSQL数据库之间的不同,远超过两 SQL数据库之间的差别。这意味着软件架构师更应该在项目开始时就选择好一个适合的 NoSQL数据库。针对这种情况,这里对 Cassandra、 Mongodb、CouchDB、Redis、 Riak、 Membase、Neo4j和HBase进行了比较:
(编注1:NoSQL:是一项全新的数据库革命性运动,NoSQL的拥护者们提倡运用非关系型的数据存储。现今的计算机体系结构在数据存储方面要求具 备庞大的水平扩 展性,而NoSQL致力于改变这一现状。目前Google的 BigTable 和Amazon 的Dynamo使用的就是NoSQL型数据库。 参见NoSQL词条。)
1. CouchDB
●所用语言: Erlang
●特点:DB一致性,易于使用
●使用许可: Apache
●协议: HTTP/REST
●双向数据复制
●持续进行或临时处理
●处理时带冲突检查
●因此,采用的是master-master复制(见编注2)
●MVCC - 写操作不阻塞读操作
●可保存文件之前的版本
●Crash-only(可靠的)设计
●需要不时地进行数据压缩
●视图:嵌入式 映射/减少
●格式化视图:列表显示
●支持进行服务器端文档验证
●支持认证
●根据变化实时更新
●支持附件处理
●因此,CouchApps(独立的 js应用程序)
●需要 jQuery程序库
非常好的应用场景:适用于数据变化较少,执行预定义查询,进行数据统计的应用程序。适用于需要提供数据版本支持的应用程序。
例如: CRM、CMS系统。 master-master复制对于多站点部署是非常有用的。
(编注2:master-master复制:是一种数据库同步方法,允许数据在一组计算机之间共享数据,并且可以通过小组中任意成员在组内进行数据更新。)
2. Redis
●所用语言:C/C++
●特点:运行异常快
●使用许可: BSD
●协议:类 Telnet
●有硬盘存储支持的内存数据库,
●但自2.0版本以后可以将数据交换到硬盘(注意, 2.4以后版本不支持该特性!)
●Master-slave复制(见编注3)
●虽然采用简单数据或以键值索引的哈希表,但也支持复杂操作,例如 ZREVRANGEBYSCORE。
●INCR & co (适合计算极限值或统计数据)
●支持 sets(同时也支持 union/diff/inter)
●支持列表(同时也支持队列;阻塞式 pop操作)
●支持哈希表(带有多个域的对象)
●支持排序 sets(高得分表,适用于范围查询)
●Redis支持事务
●支持将数据设置成过期数据(类似快速缓冲区设计)
●Pub/Sub允许用户实现消息机制
非常好的应用场景:适用于数据变化快且数据库大小可遇见(适合内存容量)的应用程序。
例如:股票价格、数据分析、实时数据搜集、实时通讯。
(编注3:Master-slave复制:如果同一时刻只有一台服务器处理所有的复制请求,这被称为 Master-slave复制,通常应用在需要提供高可用性的服务器集群。)