技术开发 频道

IT老兵雷鹏:每天敲代码写文档的创业者

  【IT168 评论】雷鹏是一个IT老兵,在技术圈打拼了十几年,曾就职奇虎360,负责搜索引擎核心研发;之后就职Yahoo北研所,负责搜索广告,广告交易(Ad Exchange)等项目。在数据库,高性能计算,分布式,系统架构上都有很深的造诣。2015年底,他决定开始创业,瞄准数据库领域,创立了Terark。

IT老兵雷鹏:每天敲代码写文档的创业者
▲雷鹏

  在DTCC大会前夕,我有幸采访到了Terark CTO雷鹏,问及他现在的工作,他说:“现在每天的主要工作就是写代码、写文档”,这句话恐怕戳中了不少码农的心,就是这样一个典型的技术宅,从默默无闻成长为数据库领域的资深玩家,他的职业道路上有哪些有趣的故事呢?作为一个数据库老兵,他对数据库的发展有哪些见解呢?

  有趣:来自数据库老兵的故事分享

  在与雷鹏的对话中,他分享了自己多年前在国内某社交网站工作时的一段经历,由于当时将频繁更新的状态信息与极少更新的用户基本信息放在同一个表中,导致了严重的性能问题,最后付出了很大代价才将问题修复。

  基于这样的经历,雷鹏建议在数据库设计和选择阶段,一定要针对具体的业务场景,设计出合理的数据库结构和系统架构,并选择合适的数据库产品。如果先选择数据库产品,就要针对该数据库产品做具体优化。

  有料:资深数据库玩家是如何看待数据库领域的发展?

  在数据库的发展史上,最初也是百家争鸣的状态,后来基于关系模型的关系数据库一统天下。随着互联网的发展,对数据库的性能和容量提出了更高要求,数据库领域遂开始了新一轮的竞争,最简单的Key-Value模型数据库被广泛使用,单机数据库扩展到分布式数据库。

  如今,国内的大型互联网公司基本都有自己的数据库产品,雷鹏认为,与专业数据库公司相比,互联网公司的数据库产品往往不够成熟和完整,大都是针对公司的特殊需求,基于开源产品进行一些定制化修改,或者基于开源存储引擎的专用数据库。

  谈及未来数据库领域的发展,雷鹏表示,事物的发展一般都呈螺旋上升的态势,未来的数据库在功能、速度、容量等方面都将有所提升。数据库用户接口会趋同,甚至出现新一代的标准化。在引擎层,过去主要是BTree,以后则可能是 LSM Tree,而 LSM Tree 非常适合用 TerarkDB 来实现。

  有用:使用 TerarkDB 提升 MyRocks 性能

  此次DTCC大会,雷鹏将在“数据存储与加速技术专场”带来主题为《使用 TerarkDB 提升 MyRocks 的性能》的分享,雷鹏表示,TerarkDB 就是用来做数据存储与加速的。在很多场景下,TerarkDB 的性能比对标产品(比如 RocksDB)的性能高200 倍以上。MyRocks 是使用 RocksDB 的 MySQL,TerarkDB 是基于 RocksDB 的存储引擎,使用 Terark 专有的可检索压缩技术可实现一个压缩率极高并且同时搜索(特别是随机搜索)速度更快的RocksDB。因此,将 TerarkDB 用到 MySQL上就是一件顺理成章的事情。

  Terark目前采用自研技术,使用全新的思路解决传统技术无法处理的问题。雷鹏表示,此次演讲的亮点就是把Terark先进的技术融入到大家广泛使用的MySQL中,从而让用户以最低的学习和迁移成本体验TerarkDB的性能。

0
相关文章