技术开发 频道

专访王颖泽:国产数据库开源之路如何可控?

  【IT168 评论】中兴风波过后,大众对国产基础软件领域的关注倒是让不少厂商“受宠若惊”。“可控”成为公众对中国造的希望,开源面临的授权问题成为一颗悬在国产厂商头顶的达摩克利斯之剑。在数据库领域,不少国产厂商都有自己的想法和理解。其中,天曦科技很早之前就曾提出希望开创一条基于开源可控的国产数据库之路。在如今这个时代背景下,我们应该如何正确理解开源可控的含义?这条路应该如何走?终点又是什么呢?与国际一线大厂相比,国产数据库厂商的生存现状如何?面临的痛点有哪些呢?

专访王颖泽:国产数据库开源之路如何可控?

  借着第九届中国数据库技术大会(DTCC)的预热,笔者见到了本期采访嘉宾——王颖泽,天曦数据库技术总监。

  对于开源可控之路,天曦科技如何解读?

  随着开源社区的发展,开源技术在国内数据库领域的应用程度越来越高,天曦科技也不例外。根据王颖泽的介绍,天曦数据库在PostgreSQL基础上对Oracle兼容性进行了整体设计,主要包括三部分:第一,在数据库内核中,具备独立的Oracle的SQL语法解析器和PL/SQL语法解析器,这可使数据库仍完全兼容PG。在SQL层,实现Oracle数据类型、Merge Into、Connect By、表空间管理、DUAL、ROWNUM等;在PL/SQL层,将其作为PG的一种新PL语言;第二,在数据库接口中,依据内核支持Oracle兼容,对接口进行改造,目标是减少用户对应用代码的修改,甚至不需对应用代码修改;第三,在数据库工具中,除了提供管理工具,SQL编辑工具等常规工具外,还特别为Oracle迁移到TXDB制作了迁移工具,该工具还支持从Oracle到PG的迁移,且对性能进行了优化。

  同样是开源技术,同样面临开源授权问题,天曦科技如何理解开源可控呢?王颖泽认为,PostgreSQL的License类似于BSD或MIT的License,是给予使用者很大自由的协议,既鼓励代码共享,又尊重代码作者的著作权。允许使用者修改和重新发布代码,也允许使用或在其代码上开发商业软件并进行发布和销售,这有利于商业集成。许多商业公司都在其上进行自己产品的二次开发,例如Pivotal的Greenplum,EnterpriseDB的PPAS等。

  正如很多人所担心的,开源并不等于可控。天曦科技所倡导的开源是指基于开源版本的二次开发和修改。可控是指拥有从数据库内核到接口再到工具的全方位研发能力,能够针对自己的产品规划或者用户要求进行产品研发或产品定制,并能应对数据库上线后的各种问题,为客户提供全面的保障。这区别于只是在开源的基础上提供咨询、实施、调优和运维等服务。

  至于为何偏偏在众多开源技术中选中了PostgreSQL,不仅仅是因为其相对自由的开源协议。王颖泽提及,PostgreSQL是业界公认较先进的开源数据库,其技术成熟、稳定可靠、功能强大,版本活跃。近几年,PostgreSQL版本更新迭代速度加快,越来越受到国内外技术人员的青睐。

  其次,事在人为。天曦科技核心团队拥有多年PG研发经验,随着对其设计和了解的逐步深入,产品规划和设计也更加合理,在保障产品质量的前提下,研发速度可大大提高,这无疑增加了团队的信心与凝聚力。数据库这种基础软件的研发,需要长期的技术积累和大量研发投入。基于PG来进行自身产品研发,充分利用社区力量,无形中增加了技术实力。从长远来看,紧跟PG社区也能使自主研发的产品得以不断提升。

  最后同样也是最关键的,天曦科技认为PG无论在功能、性能、稳定性,高可用及容灾方面都可满足市场上绝大多数使用Oracle数据库的应用场景。

  国产数据库厂商或许不是做得不行,而是说得太少!

  相较于起步早且发展成熟的Oracle,王颖泽认为Oracle无论从技术储备、研发投入、产品成熟度、品牌、上下游生态环境、客户规模/数量等都比国产数据库厂商有较大优势。国产数据库是本地化原厂服务,在服务上有很大优势。因为数据库产品的研发周期长,投入大,技术要求高,所以在产品不占优势的前提下,各个厂商都力争提供良好的服务来弥补产品上的不足。

  但是,国产数据库厂商的实力绝不仅仅是我们可以看得到的服务上的这点优势。王颖泽表示,国产数据库或开源数据库在多数应用场景中是能够从功能、性能等多维度完全替换Oracle的。以天曦数据库为例,天曦数据库的核心竞争力主要体现在两方面,一是以开源PG为基础,站在巨人的肩膀上可借助社区力量不断提升产品,如在高可用和性能监控方面,天曦科技就借鉴了PG社区的相关方案和开源项目;二是在PG基础上实现Oracle兼容,不单是从语法、接口或内核上进行兼容,而是要考虑功能的一致和性能的接近,并兼顾用户使用习惯,尽量在不修改或少修改应用程序,不改变过往编程习惯、不重新学习的基础上完成对Oracle的替换。

  此外,国产数据库厂商可以为用户的特殊应用场景提供定制化解决方案,可以针对用户要求对数据库进行定制开发。当然,国家政策层面对国产数据库还是有所倾斜的。

  虽很少受到资本市场青睐,但近年来,国产数据库已经应用到政务、制造、保险、金融等各行各业,在实践中的变现也并不差。或许,我们应该给予国产数据库厂商更多的生存空间与发声机会。王颖泽在采访中表示,中兴事件为国产基础软硬件敲响了警钟,如果核心技术问题不能解决,中兴绝不会是最后一家被制裁的中国企业。但是,基础软硬件的发展需要技术积累,人才储备,周期长,进展慢。要想产品得到用户认可和接受,需要长期投入,短期内很难为企业带来巨大收益。未来,天曦科技会在安全和易用方面进一步提升,这也将成为天曦数据库新的核心竞争力。

  前路漫漫,国产数据库厂商的成长面临哪些痛点?

  前路漫漫,道阻且长。王颖泽在采访最后表示,天曦科技正处于起步阶段,对比国外几十年历史沉淀的大厂还有较大差距。王颖泽认为,国内的数据库厂商生存压力都很大,整个数据库市场的占有率相比国外厂商还只是很小的一部分,国产厂商只有把产品做出高品质,做出特色,才能最终赢得市场认可。近年来,数据库市场在逐年增长,国产厂商在市场份额上还有较大提升空间,天曦科技坚信好的产品必将受到市场认可,用心才能得心。

  从技术方面来看,国产数据库要想发展,还需解决以下痛点:

  1、数据库人才培养:数据库人才特别是从事内核研发和接口研发的人才在国内极度缺乏。国内高校对数据库技术深入研究力度不够,而致力于数据库产品研发的相关人才更少。

  2、数据库技术积累:数据库的研发需要积累,需要承认与国外先进厂商的差距。技术积累也不是一朝一夕能够完成的,量变才能形成质变。盲目制定过高目标,不脚踏实地进行深入研究无法拿出高、大、上的产品。弯道超车要在技术创新的基础上才能实现,但是没有积累的创新就好比空中楼阁。

  3、数据库研发管理体系:数据库产品研发区别于应用项目的研发,数据库在应用系统中所处的核心地位也导致其对质量的要求区别于应用产品。数据库研发管理将直接影响最终产品的质量和进度。试想对于成百上千万行代码,模块众多,相互之间关联复杂的研发项目而言,如何平衡质量和进度之间的关系,对较大功能如何拆分进而逐步完成等都与如何建立研发管理体系有关。

  4、数据库生态建设:这也是国产数据库厂商目前非常薄弱的地方。这里的生态不光指数据库上下游厂商,比如芯片厂商,操作系统厂商,中间件厂商,备份系统厂商等,还包括使用数据库的用户和在其之上开发的应用厂商,进而包括整个培训、咨询、服务的生态体系。

  上述问题涵盖了国产数据库研发的各个环节,王颖泽表示,这些问题不是一个数据库厂商就可解决的,甚至不是依靠众多数据库厂商就能够解决的。天曦科技能做的只是从自身出发,做好自己,让大家对国产数据库更有信心。

  正如王颖泽所传达的,国产数据库确有差距,天曦科技愿意承认差距并努力追赶。国产数据库要走的路还很多,我们何不抱着一颗看好的心态期待未来呢?

专访王颖泽:国产数据库开源之路如何可控?

  第九届中国数据库技术大会(DTCC2018)将于2018年5月10-12日正式举办。本届大会以“数领先机·智赢未来”为主题,设定2大主会场及22个技术专场,邀请来自国内外互联网、金融、教育等行业百余位技术专家,共同探讨Oracle、MySQL、NoSQL、大数据、机器学习、区块链、数据可视化等领域的前瞻性热点话题与技术,想要了解更多有关大会的精彩内容请访问DTCC 2018官网:http://dtcc.it168.com/

0
相关文章