【IT168 评测】作为NoSQL的一个重要类型,文档型NoSQL通常被认为是最接近传统关系型数据库的NoSQL。文档型NoSQL的核心是数据嵌套,这种设计可以从某种程度上大大简化传统数据库复杂的关联问题。同时由于摆脱了关系模型里面的强一致性限制,文档型NoSQL还可以做到水平扩张与高可用。相比其他的NoSQL类型,文档型NoSQL的应用范围要广泛的多。
常见的文档型NoSQL包括MongoDB、CouchDB等,其中MongoDB是一个高性能、开源、无模式的文档型数据库,它在许多场景下可用于替代传统的关系型数据库或键/值存储方式,MongoDB使用C++开发,提供了很多功能,如面向集合的存储、动态查询、完整的索引支持、查询监视、复制及自动故障转移、高效的传统存储方式、自动分片以支持云级别的伸缩性。
SequoiaDB(巨杉数据库)作为文档型NoSQL家族中的新成员,其企业级的新特性颇受关注。根据SequoiaDB官网的描述,该数据库在提供文档类JSON接口的同时,能够替代HBase作为Hadoop的存储引擎。与MongoDB相比,其Hadoop接口较为完善。因此,本文将MongoDB与SequoiaDB两款文档型NoSQL同时进行测试,对比两者的功能和性能。
一、测试环境
本次测试基于的环境是6台刀片机,每台的配置为4核AMD Opteron 2378 2.4GHz,内存4GB的服务器,2x150GB Raid 0本地磁盘。操作系统使用SLES 11SP2(Kernel:3.0.13-0.27-default x86_64)。
MongoDB部署在6台刀片机上,每台物理机作为一个单节点Shard。其中两台物理机还部署了Config Server,另外一台物理机部署了mongos进程。
SequoiaDB部署在6台刀片机上,每台物理机作为一个单节点复制组,其中两台物理机还部署了编目节点,另外一台物理机部署了协调节点。
MongoDB与SequoiaDB均使用“id”作为分区键字段,每条记录平均550字节,均采用手工指定分区方式分区。
二、主要功能对比
功能 | MongoDB | SequoiaDB |
开发语言 | C++ | C++ |
类型 | 文档类 | 文档类 |
分布式机制 | Sharding | Sharding |
数据格式 | JSON/BSON | JSON/BSON |
操作界面 | Javascript | Javascript |
支持多索引 | 支持 | 支持 |
Hadoop支持 | 支持内置MapReduce | 支持Hadoop MapReduce查询,能够连接Pig/Hive接口 |
支持范围切分与散列切分 | 支持 | 支持 |
支持聚集操作 | 支持 | 支持 |
其他功能 | 支持地理索引 | 支持跨集合跨节点事务、内置支持类SQL查询、支持数据压缩 |
主要应用场景 | 数据类型多变,需要动态查询,需要多字段索引 | 数据类型多变,需要动态查询,需要多字段索引,需要事务功能(提交回滚),Hadoop环境中的数据存储 |
三、命令行操作对比
以下命令行完成创建表(集合)、插入数据、查询数据、删除表(集合)四种操作。
1、MongoDB
2、SequoiaDB