技术开发 频道

未来10年列式数据库将迎来爆发式增长

  【IT168 评论】“从2005年开始的未来15年时间里,社会需求将从交易业务逐渐转向分析业务,而列式数据库正是在分析系统领域(OLAP)里最好的技术,列式数据库必将更加受人重视。”Sybase(中国)有限公司技术总监卢东明在接受IT168采访时充满自信的说道。

  如果搁在几年前,有人问什么是列式数据库?可能不少人会很茫然。从1994年到2005年的十年时间,列式数据库几乎无人问津,而现在随着众多厂商加入到列式数据库的研发,且全球2000强公司越来越关注该领域,如今的列式数据库已经走出了阴霾,用户正在逐渐认可列式数据库,列式数据库的发展已成为必然的,。

  从行到列的变化看起来微不足道,实际上意义深远。硅谷最优秀的技术大师之一、影响深远的商业书《跨越鸿沟》(Crossing the Chasm)一书的作者Moore认为,Sybase已经将经典的数据库行式架构模式“完全”改变为列式架构,提取数据的速度比传统数据库快100倍,而且支持与多人实时共享。“这是一种全新的模式,由此可以创造无限的市场机遇。”Moore特别强调了该产品的特点,“了解列式数据库对分析的含义。” 早在2001年,Geoffrey Moore就评价说:它们是最根本、最前沿的技术。

  谈到列式数据库就不得不说列式数据库的鼻祖 Sybase,为此,IT168特别邀请到了Sybase (中国)有限公司技术总监卢东明,就列式数据库的昨天今天和明天进行探讨。

卢东明:列式数据库将迎来爆发式发展期
点击进入访谈专题

  IT168:这次离我上次采访您已有1年的时间,在这1年中,Sybase发生了很多重大的变化,如,被SAP并购。Sybase被并购后公司发展战略是否有了变化?

  卢东明:目前Sybase还是以独立子公司运营,在以后的时间里,Sybase会在移动商务、商务智能等领域会和Sap做整合,整合之后力图使Sybase列式数据库产生更多的应用,扩展Sybase产品的发展空间。

  IT168:卢总曾经是我们ITPUB社区的版主,“卢山缘”这个ID相信不少Puber都有印象,卢总现在还会经常上ITPUB社区吗?

  卢东明:现在我还经常上ITPUB社区,不过不用“卢山缘”这个ID了,我用另外一个号在ITPUB里发表一些看法,解决一些疑问。毕竟这样更能了解网友的一些更真实的想法。

  IT168:今天我们的主题是列式数据库的昨天、今天和明天。请卢总给我们讲讲什么是列式数据库?列式数据库的原理是什么?与传统行式数据库相比又有哪些不同?

  卢东明:行式数据库,数据按行来存储,虽然添加数据、查询数据较为方便,但现在的数据库应用有时需要做某些列的分析,行式数据库在查找这些列的信息时,由于其存取数据的特性,故其不能只读某列的信息,而需要把所有列的信息全部读取出来。这就使得查询效率大幅下降。虽然行式数据库也想到了索引 聚合表,但又带来了空间的暴涨。建立和维护索引也会浪费大量的资源和时间。

  列式数据库,所有数据按列存放,例如把所有id放在一起,所有姓名放在一起。即查询时只会在需要的列上做IO,这就比行式数据库效率节省90%,此外,由于数据按列式存储,每列不论是数据类型还是特征都相似,这样数据库更容易对数据进行编码压缩,因此列式数据库在每列上还有非常专利的压缩算法。这是行式数据库无法实现的。

0
相关文章