数据库 频道

数据库得生态者得天下,产学研用如何联合创新?

  独行快,众行远。作为基础软件皇冠上的明珠,数据库的发展更需要产学研用多方合作。在openGauss Summit 2021峰会上,中国工程院院士廖湘科指出,数据库是公认的最为复杂,跨技术领域最多的基础软件,其发展难度更大,更需要产业界形成合力、不断创新,来推动数据库产业的高质量发展。

  开源社区是当今科技领域最具创新的一种组织方式,在国家的“十四五”规划中,首次将软件“开源”列入其中,明确支持数字技术开源社区等创新联合体发展。数据库也要充分利用开源和发展开源,广泛吸纳全产业力量,打造根植于中国的开源社区,形成创新活力,在合理的社区治理框架和机制上有机协同,最大发挥各方合力。

  一位业内人士指出:“开源在生态体系上有着得天独厚的优势,更利于产品更快被受众接受,以便收集更多的反馈和快速迭代。”

  生态是数据库竞争的终极战场,得生态者得天下,如今各数据库厂商都在积极布局生态。openGauss自2020年6月开源以来,开源生态取得了长足发展。据悉,开源一年半以来,openGauss社区已吸引了产业链100家核心企业的加入,推广使用超过1万套,覆盖政府、金融、能源、教育、制造等行业。发展20个SIG特别兴趣小组,超过2500名开发者参与技术贡献;全球下载量超过50万,遍布全球81个国家,558个城市。openGauss社区吸引了海量数据、云和恩墨、神舟通用、南大通用等数据库厂商加入,此外,中国移动、中国联通、中国电信邮储银行、民生银行、招商银行等成为社区理事会成员,openGauss开源社区的吸引力可见一斑。

  openGauss开源生态发展如此快速的秘诀是什么?在峰会openGauss联合创新圆桌论坛环节我们找到了答案——合作共赢,联合创新。怎样联合创新?产学研用如何更好释放各方优势形成合力?开源生态最重要的三个生态用户生态、学术生态、伙伴生态的代表、业内大咖在圆桌论坛带来了他们的思考。

  开源迎来了好时代

  资深媒体人IT168企事业部总编老鱼在主持时谈到10几年前曾经与同事合办电子杂志《开源时代》,阅读量、下载量都很好,最后因没有商业价值无企业响应而无奈关停,彼时谈开源似乎有点不合时宜。现在国家政策的指引,社会、产业与个人对开源有了更多的认识与参与热情,社区治理能力逐步提高,开源迎来了好时代。

  在这样的好时代背景下,开源数据库产业生态创新的序幕拉开。产学研用的参与者共同发出自己的时代强音,演奏出国内开源数据库创新生态的交响曲。

  用户联合创新:“真”场景、“真”需求促进数据库可持续发展

  在商用落地时,不能满足用户需求的软件产品都是耍流氓,所有的联合创新最终要归结到满足用户需求上来,开源社区拉进了数据库产品与最终用户需求的距离。招商银行作为openGauss开源生态用户方的代表,第一个发言。

  招商银行总行信息技术部数据中心应用及数据库管理室主管田永江指出,包括招商银行在内的金融系统对数据库有着非常高的要求,因为数据库是最重要的IT基础设施,银行业对数据库的要求集中在高可用、高稳定,这是压倒一切的,没有稳定就没有一切。

  作为用户方,招商银行根据多年的一线实践对数据库产品有自己的一套考核标准,比如数据库在高可用、高稳定基础上,应该满足低成本、易运维、高性能等要求,数据库应该是可管理、智能的。

  招商银行与openGauss进行了联合创新,招商银行主要负责输出需求,比如在金融行业的关键领域、核心交易环节,应该需要什么样的数据库,哪些特性应该着力加强,哪些场景或者哪些特性和功能不一定要有等。为了更深入有效进行联合创新,招行银行加入了openGauss内核小组,与openGauss在内核新型存储方面联合创新,在数据频繁更新场景下,实现性能非常平稳,特别适合对性能和稳定性有极致要求的金融行业。

  招商银行作为金融行业头部企业,对数据库的需求更为广泛与深入,所提供的需求具有金融业的普适性和大行的特性,能够更好地锤炼打造openGauss金融级能力。

  田永江指出,openGauss基本上在性能、容量以及可用性等方面,能够达到现有的商业级产品的能力,这是有别于基于开源软件上修改的重要特征。正如主持人老鱼所说,金融行业银行对于数据库的要求是最严苛的,基本上银行能够满足的,其他的行业也都能够满足。

  “希望openGauss能够早日成熟,通过社区共建,通过产学研用一起努力,打造一个好的生态,能够支撑更重要的业务,实现国产数据库从能用到好用的突破。”这是用户生态代表田永江的希冀,随着越来越多的行业用户积极参与到openGauss开源社区,进行联合创新,相信数据库的突破能早日实现。

  学术界高校联合创新:人才培养和学术研究成果落地

  高校合作是生态建设非常重要的一环,是数据库发展的长期目标,不仅肩负着解决人才短缺的重任,还有难点课题公关及研究成果的落地实践。

  数据库人才短缺是世界性难题,人才培养周期长,多位业内人士指出国内数据库人才短缺问题的迫切性,经常看到百万年薪寻找数据库精英的招聘贴。根据信通院的《数据库发展研究报告(2021)》,当前数据库人才培养渠道主要有三个:高校教育、培训机构和企业。高校教育注重普适教育,重视社会人才发展大趋势需求。通过原理性知识传授、数据库系统应用实践等教学方式,为数据库产业发展提供了大量储备人才。一些企业开始加强与院校的产教融合尝试,通过与高校进行教材编撰、实训开发、专业共建、人才共建等合作项目,在高校提前培养数据库相关储备人才。

  在创新论坛来自国内最高两个学府北大和清华的高校代表分享了作为学术界与openGauss社区通过联合创新在人才培养以及学术研究成果落地的探索,两个高校团队分别研究数据库领域较为前沿的图数据库和时序数据库。IT168&ITPUB在做盘点时发现,2021年国内外数据库领域的融资,很大一部分流入到图数据库,数据库最大单笔融资也在图数据库领域。图数据库是业内当红炸子鸡,以后是万物互联的时代,作为物联网基石时序数据库代表着数据库发展的未来。

  北京大学王选计算机所教授邹磊强调,高校与企业相比,更加适合突破性的原始创新的探索,可以为企业提供更加丰富的先行先试的经验。同时企业可以为高校的原始创新提供广阔的落地应用空间。因此,融合高校和企业的联合创新体制对于构建开放式的开源社区,推动国产基础软件生态的构建方面具有非常重要的意义。邹磊回顾了团队在开源图数据库系统gStore方面的工作,并强调图数据库作为目前受到普遍关注的非关系数据库系统在很多行业有着丰富的应用场景,包括金融中风控场景、基于知识图谱的推荐场景等。作为技术创新中重要一环,未来团队在openGauss社区当中,与openGauss一起合作联合创新,为知识图谱和图数据库的发展做贡献。

  清华大学软件学院助理研究员Apache IoTDB PMC主席黄向东指出,开源社区创新联合体的发展在于创造价值,作为高校,清华大学团队能带来两方面价值,一是给用户带来价值,其团队更关注工业互联网里面的时序数据库,也有自己的开源项目。未来团队会把用户需求以及积累的技术和openGauss做技术融合,以用户需求为指引落地产品,在时序数据库方面一起为用户创造更多价值。二是给学生创造价值。很多开发者都来自于学生,openGauss这样的开源社区为学生带来实践机会。openGauss更核心的技术在于关系型数据库,让学生学到更全面的知识,为学生开源的文化和技能打下很好的基础,培养数据库人才。

  伙伴联合创新:团结共创数据库创新生态

  正如openGauss社区理事长江大勇在openGauss Summit2021峰会上所讲,数据库是需要长期投入的产业,技术创新是openGauss立足之本,生态构建是openGauss能否繁荣的关键,在商业推广方面用户开放场景是对openGauss最大的支持和肯定,开源建设和人才发展是创新的源泉,技术、生态、商业,开源建设和人才发展五大因素协同,共同打造数据库根社区。

  伙伴生态是数据库生态构建非常关键的一环,是数据库根社区上不断延展的枝杈,助力数据库能够更广泛触达用户。云和恩墨、海量数据、神舟通用、北京超图集团作为伙伴生态代表,相关嘉宾分享了伙伴参与联合创新的探索与思考。

  云和恩墨创始人盖国强是数据库行业老兵,在数据库领域从业20多年,他提到了云和恩墨加入openGauss开源社区的初心,过去中国数据库行业的发展有着深刻的矛盾,一方面是百花齐放的蓬勃创新形态,另一方面生态才刚刚起步。必须团结,凝心聚力,才有可能对国外产品进行追赶和超越。

  盖国强指出,万事归结到一点,最重要的是满足用户需求。一是满足用户当下短期需求,用户短期的需求就是安稳易用,安全、稳定、容易使用,所以云和恩墨把过去在商业数据库上构建的竞争力,如产品兼容性,迁移平稳性,运维自动化等能力带到openGauss社区,并且开源核心产品代码放到社区上去。二是满足行业的长期需求。一个产品必须是高瞻远瞩的,满足行业长期发展趋势,用户才会一直跟随,才能解决用户的长期发展的担忧。

  云和恩墨基于openGauss推出了商业发行版MogDB。盖国强将数据库行业长期发展的未来概括成一个词SPA(Security,Performance,AI)。第一,保证基础内核的安全稳定,因为《国家数据安全法》提出了非常高的要求。安全是第一要义,数据是企业的核心资产,不断地加强安全性,所以团队在安全稳定方面有投入。第二,通过性能提升,最终降低用户成本,在openGauss社区版本基础之上,MogDB在基准测试里达到了256万。第三,云和恩墨成立AI团队,把AI技术不断放到数据库内核上去,从当下到远期全力创新。

  “整个的数据库产业成功,是要靠生态,不仅有人才,还要有产学研全线投入,生态最好是形成合力,不要分散,今天openGauss的峰会就做出了表率。”盖国强指出。

  北京海量数据也基于openGauss推出了发行版,社区贡献仅次于华为,排名第二。其总裁肖枫强调,海量数据会一直坚持沿着两个确定的方向贡献,第一是客户需求,第二是完善openGauss生态。“生态是数据库成败的关键,要看生态有没有活力。沿着客户的需求走,是沿着生态,让它壮大,更加完善,这是我们继续大批量向社区贡献的基础和方向。”

  同为数据库厂商的神舟通用能够加入openGauss并进行贡献引起了大家的好奇,神舟通用总经理顾云苏介绍,大家对openGauss有很多期许,神舟通用有航天科技集团背景,其用户主要在军工、国防行业,用户更关心数据库的可靠性、稳定性不能出问题。“别的地方出问题可能是经济损失,我们这里出问题就是政治损失。”为此,神舟通用做了两块工作,一是增加了兼容性,并且把产品做好。从产品手册,产品可靠性测试,功能等方面都能够满足用户需要。二是做技术托底,在任何场景下,7×24小时的重保,必须有人在现场。

  据悉,社区神舟通用也做了相关规划,目前神舟通用一直做传统的事务处理数据库,未来是多模方向,现在遇到了大量需求,期望借助能够openGauss社区开源社区发展多模方向,支撑不同数据模型,满足不同用户的不同场景需求。

  北京超图集团是地理信息空间软件的平台厂商,其客户群体主要关注海量的空间数据。北京超图集团副总裁王海涛介绍,团队一方面考虑怎么样和openGauss结合之后更有性能的优势,另一方面是发展多模态和非关系型数据库,未来作为openGauss的补充。

  超图集团在2020年就已经有了自己的数据库Yukon(禹贡),2021年3月份与openGauss社区签署了企业版贡献协议。禹贡是中国最古老的最具有系统性的地理概念词汇,作为超图的数据库,Yukon(禹贡)主要解决两个方面问题,一是国产信创工作,地理空间数据库参与其中。二是关于新需求,比如在实景三维建设、新型测绘上配合。希望借助openGauss生态,建立更具有中国特色数据库的合作。

  在论坛的最后,各位嘉宾纷纷对openGauss的发展表达了自己的祝福和信心,大家希望以开放的心态,共建开放平台,共同完成历史使命。相信在未来三到五年时间,openGauss社区可以引领中国乃至全球数据库的创新体系。

  华为云与计算开源业务总经理&开放原子开源基金会TOC主席堵俊平指出,openGauss社区三方生态联合创新的发展,打破了原来所认为的开源数据库只是内核不能用于生产的固有认知。openGauss在产学研用各方联合创新下,走向了更大规模的生产级的创新。

  “openGauss成熟度各方面都非常好,非常完备,完全可以做生产级替代,但是未来创新空间依然很多,跟AI的结合,跟地理信息结合,或者面向IoT场景,面向图计算场景,大数据、隐私计算,未来空间非常大。在openGauss很多领域,我们项目已经比较成熟,但是创新永不止步,今天主题也是要汇聚数据库创新力量,面向未来是逐梦数字时代的星辰大海。我们有足够的空间欢迎新用户加入一起创新,我们完全是开放的、创新的、共赢的社区。”堵俊平总结时强调,创新永不止步。

0