数据库 频道

2021星环科技春季新品发布会侧记

  2014年末,老鱼听说有家初创公司,名为星环科技(以下简称:星环),放言要做“大数据时代的Oracle”,口气不小,是噱头还是真有实力?带着这些疑问,在2015年的DTCC大会上,老鱼采访了其创始人孙元浩。“这是个干实事的人”,当时在这篇采访文章下的一条用户评论,让老鱼至今印象深刻。

  随后的星环成长之快,如一路开挂,2016年被Gartner评为全球最具有前瞻性的数据仓库及数据管理解决方案厂商,2017年被IDC评为中国大数据市场领导者,2018年,成为12年来全球首个完成TPC-DS测试并通过官方审计的数据库厂商。

  截止目前,星环已完成D2轮融资,累计完成融资总额约15亿元人民币。

  去年底,星环已与中金公司签署上市辅导协议,拟科创板挂牌上市。

  因此,3月24日,星环春季新品线上发布会就尤为引人关注。因为新品发布会是了解该公司过去一年成果的重要途径。当然,作为媒体人,老鱼其实更关注这些新产品背后基于用户推动实现的一系列突破与创新,以及经过多轮融资之后,星环是否还能坚守初心。

  此次发布会上,星环发布了众多全新产品版本,主要包括TDC 2.4、TDH 8.0、Sophon 2.7、TDS 2.2、ArgoDB 3.0、KunDB 2.0等。

  近三个小时的发布会,发布的新品之多、信息密度之大、技术性之强,着实不太好消化。但换个角度看,或许就容易的多。

  从产品体系看,星环产品家族由四大品类组成:

  从上图可以看出,分别有数据云、大数据基础平台、数据开发与智能分析、分布式数据库。

  一、大数据基础平台

  星环的代表产品是TDH(Transwarp Data Hub):容器化的一站式大数据综合平台。

  放在第一个说,是因为TDH是星环最早诞生的产品,也是基础产品,星环其它所有品类产品都是围绕这个产品展开增强。

  众所周知,TDH最初基于Hadoop,但星环最终放弃了Hahoop技术路线,进行了重构,而完成重构,星环用了6年。

  孙元浩告诉老鱼,Hadoop是十几年前的技术,现在已经跟不上硬件的发展,其次,星环一直试图将Hadoop做到极致,但在高性能高并发的情况下,总是碰到问题无法突破,这是由Hadoop自身架构决定的,因此,与其改来改去还不如重写。另外,星环要做到世界领先,需要更多的突破与创新。

  从上图可以很清楚的看到,TDH技术架构由“蓝”变“绿”的变化,从基于Hadoop到超越Hadoop,再到完成自主重构。如今“绿”色的部分越来越多,这意味着星环产品中自主原创的技术越来越多,背后所体现的是星环科技原创领先性研发战略。

  此次发布的TDH 8.0,从技术架构图上看,最明显的变化是存储层,星环对存储引擎进行了扩展,支持8种存储引擎(去年是4种)、10种存储模型,几乎涵盖了所有的主流数据模型,将多模数据平台发挥到极致。

  这样做的好处在于,用户不再需要维护多个数据库,一个平台就能解决所有数据类型,大大降低了用户运维及开发成本。

  据孙元浩介绍,每个存储引擎,星环都进行了优化和功能增加,尤其是图数据库进化比较大,内置了不少分析算法。

  另外,TDH8.0对文件系统TDFS进行了重构,能支持大规模数据量,并且可以完全分布式。

  二、分布式数据库

  根据去年的信息,星环分布式数据库在国内的装机量已经在10万+级别,今年,老鱼还没拿到最新数据,但肯定数据会增加。

  OLAP(分析型数据库)

  分析型数据库,星环有两款产品,分别是Inceptor和ArgoDB。

  Inceptor是基于Hadoop打造的分析数据库,ArgoDB则是专为新一代硬件闪存(傲腾)打造,完全自研的高性能分析型数据库,目标是替换MPP数据库。

  二者区别在于,Inceptor用于离线处理、数据仓库业务场景。而ArgoDB则能够满足数据仓库、数据集市混合业务场景。

  2018年,星环通关TPC-DS测试,Inceptor是第一个通过的,ArgoDB在性能测试中也取得了亮眼成绩。

  此次发布的ArgoDB 3.0,相较于 2.0版本,性能提升5倍以上。同时,ArgoDB3.0采用和TDH8.0一致的技术架构,更好地满足了数据多模、联邦计算的需求。

  另外与竞品不同,星环大部分工程师出自英特尔,因此对于硬件和底层系统软件有较为深刻的理解,在充分发挥新硬件性能上有着自己独特的优势。

  OLTP(交易型数据库)

  KunDB是一款纯分布式的交易型数据库,虽然起步较晚,但却是星环投入重点。

  交易型数据库关键技术分布式事务,KunDB提供了全局事务管理器分配事务ID,通过二阶段提交保证事务的原子性,基于事务ID管理可见性范围,提供了隔离级别,加上redolog和undolog保证持久性,从而确保了全局事务的ACID属性。

  在信通院组织的金融核心交易性能测试中,KunDB通过了性能测试和高可用测试。

  KunDB支持云上部署,支持跨CPU架构混合部署和在线升级,还有资源隔离、弹性调度等云技术的深度融合,提供基于云的多租户方案。除此之外,KunDB还提供了开发工具链和运维工具链。

  据介绍,目前KunDB已在中石油销售公司、上海市大数据中心、郑州地铁、鹤壁市大数据中心等应用。

  与1.5版本相比,此次发布的KunDB2.0在TPC测试中的成绩提升了接近两倍。

  目前,星环还提供ArgoDB与KunDB的整体解决方案,同时提供了TP和AP两种能力,这是星环的一个杀手锏。

  三、数据开发与智能分析

  数据开发与智能分析,星环有2款产品:Transwarp Data Studio(TDS一站式数据开发与治理平台)和Sophon(人工智能平台)

  此次两者均有更新:TDS 2.2、Sophon2.7 LTS。

  与TDS 1.x 相比,新版本新增了两个子产品,一个是数据质量管理工具 Governor,用于管理数据从获取到消亡每个阶段里可能引发的数据质量问题;另一个是数据商城 Transwarp Foresight,它整合了 TDS 的数据服务开发工具 Midgard 和标签开发工具 StarViewer,为业务人员提供数据资产的检索、下载、共享的能力,结合着数据血缘帮助数据使用者、开发者和管理者做整体协同,构建其数据运营能力。

  除以上提到的四个工具之外,TDS 的子产品还包括:面向数据库 SQL 程序开发者的桌面集成开发环境 Waterdrop、网页版的团队协作的 SQL 开发环境 SQLBook、可视化的 ETL 开发工具Transporter、数据计算任务的调度平台 Workflow、数据可视化工具 Pilot 、数据 API 的开发与管理工具 Midgard以及数据资产管理工具软件 Catalog。

  星环AI总监杨一帆表示, Sophon 2.7 LTS,将是Sophon 2.X系列的最后一个长期支持(LTS)版本,提供企业数据、信息资产和智能设备的全链路AI方案,覆盖AI模型和数据全生命周期,支持从数据导入、数据探索、数据预处理、特征工程、模型训练、性能验证、模型部署、模型管理的全流程,实现AI建模的全生命周期管理。

  Sophon 2.7 LTS带来了三大子产品线,分别是数据科学平台Sophon Base 2.7 LTS、知识图谱Sophon KG 2.7 LTS,以及边缘计算平台 Sophon Edge 2.7 LTS。作为LTS版本, Sophon2.7三大产品线在性能、功能、可靠性上都有大幅提升或增强。

  据介绍,新版本的分布式算法相较开源有成倍的提升,而优化的模型API,响应时间较上一版本提升5~50倍,吞吐量提升35~160倍。

  四、数据云

  数据云TDC(Transwarp Data Cloud),也有说是数据中台,包含数据仓库、数据资产管理等一整套工具,是星环这几年大力布局的方向。

  Snowflake上市之后,“Data Cloud”这词就火了,但其实早在2018年,星环就已经率先提出“数据云”的概念,并发布了TDC 1.0版本。因此,星环可以说是国内最早推出数据云产品和解决方案的企业。

  TDC主要面向企业私有化场景,以数据为中心,打通了数据 PaaS、分析 PaaS、应用 PaaS 三类 PaaS 能力,底层统一基于容器云平台构建。

  此次发布会上,星环发布了TDC 2.4版本,拥有5个核心特性:1、支持多种业务类型的工作负载。2、云原生调度实现数据与计算局部性3、分布式计算执行单元场景化扩缩容。4、支持GPU 多租户共享调度。5、支持异构 CPU 和操作系统混合部署。

  写在最后

  很多人可能并不清楚,星环(Transwarp)这家公司的初心其实就蕴含在其公司及产品名字中。

  Transwarp是所有科幻小说中是最快的一种引擎,超过曲速引擎,公司取名Transwarp,背后代表的是星环第一层初心,打造一个超高速大数据引擎。星环的第二层初心则是希望打造一个Data Hub(大数据平台)实现多种模型数据的超高速处理。

  很显然,从此次新品发布会来看,星环基本做到了。

  曾经老鱼也困惑,星环到底是家怎样的公司?数据库公司?大数据公司?还是人工智能公司?

  从此次发布会来看,老鱼觉得,说星环是一家数据处理工具公司似乎更恰当,因为它几乎把与数据相关的平台及工具全部都做了。

0
相关文章