【IT168 评论】日前由IT168编译并发布的(2014年12月世界数据库流行度排行榜)可以看到,全球数据库排行榜前十中,NoSQL数据库已经占了三席。这说明NoSQL正在变得越来越流行。对传统的关系型数据库而言,单纯靠SQL数据库,在面对超大型Web应用上显然捉襟见肘了。NoSQL数据库凭借其易扩展、高性能、高可用、数据模型灵活等特色吸引到了大量新兴互联网公司的青睐,包括国内的淘宝、新浪、京东商城、360、搜狗等都已经在局部尝试NoSQL解决方案。
我们很欣喜的看到,在NoSQL这个新兴数据库市场中出现了国产数据库的身影,与国产传统关系型数据库不同,它一出现就已站在与国外同类产品同一水准的位置上,它就是SequoiaDB。
在2015中国Hadoop技术峰会上,IT168专访了巨杉数据库CTO王涛,王涛为我们独家揭秘了SequoiaDB的由来,开源决策及2015年规划。
老鱼:王涛,很高兴今天能采访到你,你是我们ITpub DB2版主,算是老熟人了,不过按照惯例还是请你先为我们网友介绍下自己和巨杉公司,SequoiaDB相比其它竞争对手的特点。
王涛:OK,我们做了一个NoSQL数据库,英文名是SequoiaDB,中文名是巨杉数据库。
先说一下我个人的背景。我原来是ITpub社区的DB2的版主。过去,我在IBM的DB2多伦多实验室工作,DB2是传统的关系型数据库,我们从硅谷看到了全球大数据这个发展趋势,同时也看到NoSQL是一种颠覆性创新的技术。而像IBM、Oracle这种大型公司是不可能投入资源到NoSQL这种颠覆性创新技术上的,因此我们几个兄弟就出来成立一个团队,决定自己做一个NoSQL数据库产品。
SequoiaDB是文档类的NoSQL数据库,在业界跟它比较类似的是MongoDB,大家都比较熟悉了,而Cassandra、Hbase这都属于NoSQL数据库范畴之内,但是和我们还有一些略微的区别。
我们现在已经把SequoiaDB开源了,在我们开源之前的那段时间,有家外国的公司叫Bankmark(一家德国的独立基准测评机构),拿我们的产品和MongoDB、Cassandra做了个性能对比评测,从评测结果来看,我们的SequoiaDB在业界的同类产品里,在某些方面还是比较领先的,至少从总体结果来看跟国际的同类产品处于同一个水准。
总体来讲,在大数据的这个趋势下,大家都知道Hadoop,而我们作为NoSQL也是属于这个生态圈的一员,SequoiaDB可以作为替代Hbase的选择。
老鱼:刚才你说到Bankmark评测(三款NoSQL数据库SequoiaDB、MongoDB以及Cassandra评测),SequoiaDB在这次评测中取得了一个比较好的成绩,我们IT168也编译了这篇报告,SequoiaDB成绩比MongoDB好,与Cassandra不相上下,这是个非常出色的成绩了,为什么能够取得这样一个成绩,你认为这个成绩是得益于什么?
王涛:这是个关于性能的评测,从产品上来讲, MongoDB本身是一个综合类的数据库,是文档类的,MongoDB并不是以纯性能著称,这是历史原因造成的, MongoDB的优势是功能丰富,但MongoDB设计是以快速开发、快速叠带为目的,所以在性能方面相对就不是非常的出彩。
而Cassandra和Hbase,在设计时架构比较简单的,用的是BigTable这种与Google类似的玩法,这种玩法会造成它的性能在某些场景上,比如纯插入, Cassandra是非常快的。但是在读取时,就会有一些性能瓶颈,并且Cassandra、Hbase在功能上跟mongoDB还是有很大的差距。
另外与MongoDB对比,我们还有一个后发优势,我们在做SequoiaDB的时候,实际上是能够很清楚的看到业界对于NoSQL在哪些方面看中,哪些方面相对不是那么看中,因此在设计时是相对最完善的,所以我们在功能上很多场景能够跟mongoDB齐头并进的,但在性能上我们会比它高很多。
老鱼:我看到相关报道,巨杉数据库今年在国内拿到了不少客户的单子,能不能给我们分享下,SequoiaDB具体的应用场景与业务。
王涛:好的,我们现在把客户分成两大块:一块我们叫“互联网客户”,一块叫“传统行业客户”。
首先来说下传统行业客户,我们在几个重点行业做的相对较多,如金融,金融行业可能是很多数据库厂商的大单出处,民生银行、中国银行、银联都是我们的客户。其次是电信。中国电信、中国移动也都有在使用我们的产品。而交通,海南航空是我们的客户。
互联网客户这一块,蓝讯在用我们的数据库,当然还有一些其他的。
应用场景,我们也分成两种类型,一种类型是作为纯数据库来使用的,就是NoSQL数据库。对于这种场景来说,用户主要关注的点第一是可发展性,第二是用这种非结构化的数据模型来解决关系型数据库需要做种关连,就是所造成的数据模型复杂的问题。比如你有很多不同类型的产品,在过去,每一类的产品可能都要定出一种数据模型,这样一来如果要新增一种新的产品,那么需要对数据结构进行调整,这是相对比较麻烦的,可能要重新改数据结构的定义,重新改应用。但是现在,使用这种非结构化的数据,可以非常自由的来调整整个数据的结构,比如说加一种新的数据类型,就是一种产品类型。
而另一类则是大数据的解决方案,与Hadoop相关,我们也有不少案例,如我们在移动的一个案子里,它的数据峰值每小时会有300GB左右的增量,要把这300GB的数据按照每小时来进行分析。看有没有用户问题,比如说用户的一些操作失败之类的问题,它会做一个分析。然后把这个分析结果会存到一个数据库里面。这个场景下,我们是跟hadoop在一起在做的。
所以总的来说,我们在应用场景里面就是分NoSQL数据库本身和Hadoop相关大数据解决方案。
老鱼:12月份的时候SequoiaDB开源了,之前我看到很多很好的开源产品,最终都活的不是很好,比如MySQL,被Sun收购后又落入了甲骨文手中,SequoiaDB开源后如何保障公司生存?
王涛:开源是一种商业模式,现在的开源环境与10年前相比是完全不同的,在十几年前市场环境不成熟,开源可能就是做雷锋,但现在则不同。另外数据库是基础类软件,不像应用,应用开源后被抄走后可能就搞不定了,但数据库一定有个服务在里面,就是我们常谈到原厂支持。Mysql当初被Sun以10亿美金收购,对吧,但现在回头来看MySQL的市场普及率,则远超过这个价值。
开源实际上是新兴软件的一种标准国际化商业模式,我们看到基本所有的NoSQL数据库都是开源的。
MongoDB最近又获得了8000万美元的融资,说不定下个融资后就它就冲上市了,所以不能说开源了就没法活了。开源是一种对于市场化的非常有效的促进手段,通过开源,让大家都更深入的了解我们的产品。开源是一种比较成熟业务模式,投资机构一看就能理解我们这可以怎么玩,知道怎么从中里面去盈利。
老鱼:你刚才提到了MongoDB获得8000万美元融资,其实今年你们也拿到了千万美元级A轮融资,对吧,我想知道巨杉数据库这次拿到了投资后,这些投资会被用在什么样的地方?
王涛:这个问题涉及到我们2015年的规划,投资主要会用在两个方面:技术和市场推广。技术这块毫无疑问,我们一定要把技术打磨的更好。怎么才算好?我觉得差异化是非常重要的。因为在过去,咱们国人做一个软件,经常是跟着国外跑,国外做什么,咱们就做什么。而现在,我们既然开源了,开源本身就是一个国际化的事,那我们就要把自己摆在一个国际的舞台,因此我们一定要做出自己的特色,这个特色不是简简单单说我是做一个某某功能,而你能够解决其他产品解决不了的问题。这是我们今年在思考的事情,也是要着重做的事。
另外,我们在云服务上面也要下功夫,因为我们看见云服务一定是未来的一个非常重要的趋势,我们会去发布一个数据库的云服务平台。这个云服务平台不是说我们要自己建一个,而是与其他厂商合作,如阿里云、腾讯云、亚马逊等,大家一起合作来打造生态圈。
最后关于市场,我们一方面要在国内继续积蓄培育市场,另一方面是海外市场,之前我说过开源是个国际化的事,因此我们不应该把眼光仅仅聚焦在国内,我们会把我们做的事情告诉世界,我们做了这样一个产品,欢迎大家来试一试。