本周,SingleStore宣布与IBM合作推出SingleStoreDB;Databricks公司宣布Delta Live Tables全面上市;NetApp将收购DBaaS供应商Instaclustr;TiDB 6.0 发版,向企业级云数据库迈进。最近一份来自SAS的报告显示,大流行发生以来,一些数据科学家对自己的角色不满意,他们在进行有效工作时面临障碍。

投融资并购
NetApp将收购DBaaS供应商Instaclustr
NetApp于4月7日宣布已经签署了一项最终协议,将收购数据库即服务(DBaaS)供应商Instaclustr,该项收购预计将在30至45天内完成,但须经监管部门批准,NetApp没有透露具体收购金额。
Instaclustr自2013年公司成立以来,已经筹集了2200万美元的风险资金。该公司提供一系列管理云服务,包括为其用户提供数据库即服务(DBaaS),主要基于开源技术。在Instaclustr提供的管理云服务中,有Kafka,Apache Cassandra,以及最近由于2021年3月收购Credativ而提供的PostgreSQL数据库功能。
NetApp执行副总裁兼公共云服务总经理Anthony Lye说,NetApp对Instaclustr的收购是其在云和企业内部运行开源数据库能力的一部分,这已经成为NetApp为客户优化云的核心。
产品与解决方案
SingleStore宣布与IBM合作推出SingleStoreDB
数据密集型应用的单一数据库SingleStore今天宣布与IBM合作推出SingleStoreDB,旨在为企业提供一站式服务,使其能够利用SingleStore的强大数据库技术与IBM合作。
通过新的合作,IBM将提供SingleStore数据库的采购、许可和支持。此外,客户可以与IBM专家实验室或IBM咨询公司合作,获得全球部署支持,其中包括对单个数据库技术和整体数据管理架构的咨询,包括数据结构。
2021年11月,IBM风险投资公司对SingleStore进行了投资,作为其F轮融资的一部分。
Databricks公司宣布Delta Live Tables全面上市
4月5日,Databricks今天宣布Delta Live Tables(DLT)全面上市,DLT是用来构建可靠的数据管道并自动管理数据基础设施的ETL框架。将SQL查询变成生产ETL管道往往需要大量繁琐、复杂的操作工作。通过自动化数据工程中最耗时的部分,数据工程师和分析师可以专注于交付数据而不是操作和维护管道。
DLT通过允许工程师简单描述数据转换的结果来简化ETL开发,能够自动消除几乎所有的人工复杂性。它还使数据工程师能够将他们的数据视为代码,并应用现代软件工程的最佳实践,如测试、错误处理、监控和文档,以便更容易地大规模部署可靠的管道。Delta Live Tables完全支持Python和SQL,并为流媒体和批处理工作负载量身定做。
TiDB 6.0 发版:向企业级云数据库迈进
4月7日,TiDB 6.0 发版,在最新版本中,加强了作为企业级产品的可管理性,强化了容灾能力,以及更为成熟的HTAP能力,与此同时也加入了诸多云原生数据库所需的基础设施。值得一提的是,TiDB 6.0 发布后,针对企业级用户的稳定性要求,再次进行了发版模型调整。从 6.0 版本开始,在 2 个月为周期内的版本迭代基础上,TiDB 发版策略将引入半年为发布周期的 LTS(Long Term Support)版本,同时为用户提供只包含修复的长期稳定版和快速迭代版以兼顾不同倾向的版本需求。规划中的 TiDB 6.1 将作为第一个 LTS 版本发布。
强化可管理性。TiDB指出,除了性能,可用性和功能等常规维度外,一个重要维度就是可管理性,可管理性维度也会很深地影响用户实际使用数据库的隐性成本,而这点对于云数据库则更为明显。在可管理性方面,TiDB 6.0 引入数据放置框架(Placement Rules In SQL),增加了企业级集群管理组件 TiDB Enterprise Manager ,开放了智能诊断服务 PingCAP Clinic 的预览,加强了生态工具的可运维性。
强化容灾能力。在TiDB 6.0中,作为数据容灾的关键组件,TiCDC 迎来了核心能力增强:通过对整个处理增量数据处理过程的优化、控制拉取事务日志速度等方式,TiCDC 在大规模集群数据容灾方面的能力有了长足的进步。
此外,新版本的HTAP能力也更为成熟,TiDB 5.0 是其分析引擎架构初步成型的版本,该版本引入了 MPP 执行模式,从而得以服务于更广的用户场景。6.0版本中的分析引擎 TiFlash 拥有更多算子和函数支持、更优的线程模型、更高效的列存引擎,新版本整体性能在 TPC-C 测试中相对 5.0 版本提升了 76.32%。
The Others
42%的数据科学家表示其工作成果没有被决策者采用
最近一份来自SAS的报告显示,一些数据科学家对自己的角色不满意,他们在进行有效工作时面临障碍。其报告“加速数字化转型 ”旨在深入研究数据科学的状况,评估大流行的影响,以及分析领域的满意度。
调查指出,42%的数据科学家说他们的数据科学成果没有被商业决策者使用。尽管90%以上的受访者表示其工作的重要性与大流行病前相同或更甚以往,但还是出现了项目乏善可陈的情况。
调查发现了技能差距,不到33%的数据科学家认为,他们在云管理和数据库管理等程序密集型技能方面具有高级或专家级的熟练程度。94%的受访者在大流行之后经历了与之前相同或更多的云使用。