3 月 25 日,由中国计算机学会(CCF)数据库专业委员会指导,国产分布式数据库 OceanBase 与蚂蚁技术研究院联合举办的第二届 OceanBase 数据库大赛公布了获奖名单,来自浙江大学的 K-ON! 队荣摘桂冠。
冠军团队K-ON! 队领奖时照片
据悉,OceanBase 数据库大赛发起于 2021 年,本届大赛于 2022 年 10 月启动,历时 6 个月,经历三轮角逐。大赛吸引了国内外包括加州大学圣地亚哥分校、悉尼大学、南洋理工大学、清华大学、北京大学、浙江大学、香港中文大学、西北工业大学、华东师范大学、电子科技大学等219所院校1180 支队伍,1988 名选手参赛。此外,来自华为、快手、美团、北京银行、百度等企业界的开发者也参与其中。
OceanBase的两次大赛都定位在“数据库内核开发大赛”,突出“内核”两个字,剑指数据库内核人才短缺困境。
数据库内核人才短缺困境
数据库是基础软件皇冠上的明珠,但是欲戴王冠必承其重,数据库研发难度大,研发周期长,一个产品的面市往往需要七八年的时间甚至更久。这个市场长期面临着人才短缺问题,尤其是内核研发人才严重不足,有业内人士调侃道:搞数据库内核的人像大熊猫一样稀有,大家挖来挖去还是同一拨人。
数据库内核研发人才短缺困境是一个全球性的问题。一位从事数据库内核研发十多年的专家指出,数据库内核开发其专业性比较强,一款优秀的数据库架构、存储引擎、事务管理、优化器等技术复杂度较高,常见的操作系统、底层开发语言、网络通讯、算法、数据结构等底层技能也都是基本要求。所以,一名优秀的数据库内核开发人才应该是具有较全面技术的综合型技术人员,这属于稀缺人才,而且数据库内核研发人才的培养周期普遍较长。
对于数据库内核人才短缺的问题国内比国外感触更深,数字经济时代,数据已经成为新的生产要素,数据库作为数字时代的基础设施其重要性愈发突出,需求也更加旺盛。目前国内数据库市场百花齐放,数据库内核人才严重不足,破局之道在于吸引更多新鲜的血液壮大人才队伍。
“OceanBase每年有很多校招生,但不一定有数据库的背景。怎么让这些校招生更快上手数据库内核开发,是我们经常需要面对的问题。”OceanBase数据库大赛发起者封仲淹表示,与此同时他发现很多对数据库感兴趣的学生和数据库爱好者缺乏好的项目参与进来,OceanBase也一直在推动产学研协同育人的联合教学,于是决定往前走一步,帮助学生和数据库爱好者能够理论与实践结合,能够更好地学习数据库相关知识,所以就有了OceanBase数据库大赛。
产学合作以赛促学育人才
“OceanBase数据库大赛,是一个寓教于乐的大赛,也是面向数据库内核实战的工程性大赛。”封仲淹说,OceanBase数据库大赛是在数据库人才培养上的一个尝试,期望为中国基础软件的发展贡献自己的力量。
“数据库一枝独秀不是春,百花齐放才是。”OceanBase 首席科学家阳振坤表示,人才成长需要周期,人才培养需要持续。他坦言,“十几年前我们成立数据库项目组时,很多人没有数据库的学习经历,我们也是一边学,一边做。后来我们成立了公司,就在想或许我们能做一些事情,让更多高校学生对数据库感兴趣,让更多数据库爱好者学习到丰富的数据库知识。”
自2010年立项,十三年里OceanBase已经成长为颇受欢迎的企业级原生分布式数据库,并有志于成为一款世界级主流数据库。OceanBase曾打破世界纪录,连续 10 年稳定支撑双 11,在蚂蚁的试验田练就了强大的内核引擎能力,在国有大行等头部金融客户的落地验证了其稳定性和可靠性,2021年OceanBase将300万行核心代码向社区开放,具备提供过硬实战环境的基础,可以为学生和数据库爱好者提供一个尽情施展的舞台。
据悉,OceanBase数据库大赛参考了国外数据库大赛的经验,题目的设置由浅入深,“从0到1打造你的数据库”,这是一场数据库内核实战赛事,成为工业界与学术界一个沟通的桥梁,让理论与实践相结合,促进创新人才培养,提升工程化能力。
相比去年,第二届 OceanBase 数据库大赛的规格、参赛选手队伍与人数、赛事热度均有所提升,今年的赛题设置上更注重培养选手的工程实战能力。基于数据库应用场景和批量的数据,给选手一个demo,让选手进行性能优化,将数据更快地加载出来,工作起来。在两届赛事的举办中,OceanBase也沉淀了《从 0 到 1:OceanBase 原生分布式数据库内核实战基础版》《从 0 到 1:OceanBase 原生分布式数据库内核实战进阶版》《OceanBase 数据库源码解析》等多本书籍供大家学习。
大赛评委对本届大赛给予了高度评价,为参赛选手加油打气送祝福,鼓励大家投身数据库产业中去。
中国人民大学明理书院院长杜小勇表示,希望同学们通过这次大赛能够认知数据库,能够喜欢数据库,在未来的学习和生活中能够选择数据库,并投入到数据库产业中去,为发展国产数据库贡献力量。
西北工业大学计算机学院副院长李战怀表示,通过比赛,选手们接触到了工业界的数据库管理系统以及真实的场景的应用需求,希望大家再接再厉,将来对中国数据库事业的发展作出自己的贡献。
参赛选手们对第二届OceanBase数据库大赛也给出了较高的评价,来自浙江大学的冠军队选手林雨欣指出,此次参赛最大的挑战是面对庞大的 OceanBase 源码的茫然,最大的体会是工业级数据库的复杂。为了实现工业级别的数据库,光靠教材/论文里的算法是远远不够的,对细节的处理可能很繁琐。比如一个简单的字符串处理,就要为了支持各种字符集,做各种复杂处理;为了保证数据的安全性,也要做很多额外的校验工作。
冠军队的另一位选手林浩然介绍,这是他们第一次接触一个工业界能真正应用在生产环境中的数据库系统,在这样的系统里实现一个功能给了他们最大的收获,因为像OceanBase这样一个工业界的数据库系统非常复杂,不像在学校里面写了几百、几千、几万行代码,它的代码量能达到几百万行。他相信如果能做好数据库这样具有挑战性的基础软件,做其他的工作也不会差。
OceanBase举办的这样一个数据库内核实战赛事,给莘莘学子和数据库爱好者一个了解工业界数据库的机会,提供工程化应用环境试炼,以赛促学,未来,OceanBase也将继续与高校合作,探索更多产学研协同育人的有效模式。
面对数据库内核人才短缺的困境,越来越多的数据库企业联合高校,以产学研联合创新的方式破局,比如联合高校进行课程改革,共建竞技平台,联合出版教材等。为了方便产学研合作,甚至有的数据库企业将研发中心或创新中心设立在大学旁边。然而人才培养非一朝一夕之事,短期内无法大力出奇迹,需要企业、学校、社会各界共同努力,也需要大家更多耐心和恒心。很高兴,OceanBase们正在这条路上努力前行。