“初雪”与“向量化”| StarRocks Hacker Meetup小记-数据库专区

“初雪”与“向量化”| StarRocks Hacker Meetup小记

作者：厂商动态编辑：张丽慧 2021-11-10 10:24 来源：厂商稿

　　StarRocks Hacker Meetup是StarRocks社区组织的面向开发者的线下活动，旨在通过面对面的交流帮助开发者深入了解StarRocks核心功能的实现原理，和开发者共同探讨数据库领域的前沿技术。

　　第一季Hacker Meetup共4期，将持续2个月，每两周探讨一个StarRocks的核心功能。欢迎大家持续关注。第二期Hacker Meetup将在11月20日与大家见面！

　　上周六，北京迎来了2021年的初雪。StarRocks社区也迎来了第一期Hacker Meetup：向量化编程的精髓。尽管雨雪交加，但开发者们热情不减，现场座无虚席。小伙伴们对这次的活动都感觉收获满满：

　　干货回顾

　　在本次Meeup上，康凯森同学深入浅出的从几个方面向大家介绍了数据库向量化编程的要点：

　　·How to build a fast database

　　如何构建一个性能卓越的数据库？凯森分别从预处理VS现场处理、架构、数据流、系统资源4个角度进行了回答。

　　·The basics of CPU vectorization

　　凯森用Top-down的性能分析方法介绍了影响CPU性能的关键点，然后介绍了CPU向量化的基本概念和6种向量化编程的方式。

　　·The key points of database vectorization

　　数据库的向量化不仅仅是CPU指令的向量化，而是一个巨大的性能优化工程。凯森首先介绍了数据库向量化的关键点：数据组织方式、算子和表达式的向量化，SIMD如何加速Filter、Agg和Join，然后通过具体实例介绍了数据库单核CPU性能优化的几个关键点：数据结构和算法、自适应策略、SIMD优化、内存管理优化、C++ Low Level优化和CPU Cache优化等，最后推荐了一些好用的性能优化工具。

　　·Thinking of StarRocks vectorization

　　凯森介绍了StarRocks向量化工程的一些思考和总结。

　　即使顶着风雪也要相见的开发者们，期待下次相聚！

　　下期预告

　　数据驱动的前提是能够快速、准确地获取和分析数据。为了满足业务日益增长的实时更新需求，StarRocks重新设计并开发了存储引擎，在保持查询性能不受影响的前提下支持实时更新，并在单表简单查询下获得了10倍以上的性能提升。

　　下一期，将由StarRocks核心研发、Apache Kudu PMC常冰琳带来【列式存储中实时更新与查询性能如何兼得】。本次Meetup，冰琳会详细解读StarRocks 2.0版本中最新发布的实时更新引擎，快快扫描下方海报二维码报名，一起来一探究竟吧！

　　时间：2021年11月20日14:00-17:00

　　地点：拓荒族三层（中关村创业大街10号楼）

　　演讲嘉宾：常冰琳（StarRocks核心研发，Apache Kudu PMC）

　　*受疫情影响的原因，本次Meetup入场券有限，先到先得。社区将会审核您的报名信息，StarRocks项目的Contributor拥有优先通过权，请以报名成功的短信通知为准。

　　这个冬天，让StarRocks陪你尽数领略技术之美！

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

关注我们