数据库 频道

同质化时代,易用性与稳定性是时序数据库选型的首重

  CnosDB社区发起人Harbour有幸接受了IT168的采访,从时序数据库的学术定义和起源开始,讲述了时序数据库在商业层面的市场规模、技术路线、发展趋势以及应用场景等话题,突出了易用性与稳定性对于时序数据库的重要意义。本文将带您重新回顾这次采访。

  怎么定义时序数据库

  维基百科给出了时序数据库的定义,总结起来就是针对时间序列数据进行存储,以时间为单位做索引的数据库。

  时序数据库是如何起源诞生的

  时序数据库脱胎于关系型数据库,因为一些关系型数据库无法满足对时间序列数据的存储需求,甚至改造过的大数据系统也不能很好地支持时间序列,且系统的易用性和生态存在问题,以美国InfluxDB为代表的数据库应运而生。它独立于关系型数据库和大数据系统,专为时序数据做了数据库,这就是时序数据库的起源了。

  时序数据库适用于哪些行业

  一个非常有趣的论述——时序数据库是真正连接物理世界和虚拟世界的数据存储软件系统。首先从物理世界来看,物联网传感器、车联网、各种监控探头等等产生的都是物理世界的真实数据。 那么适用于这些场景的话,时序数据库也能在这里起到非常大的作用。另一方面,虚拟机、Docker、 K8s等产生的,以及金融量化交易数据等等,都是带有时间序列特征的虚拟数据,时序数据库也能在这些场景中发挥作用。

  怎样看待时序数据库发展趋势

  首先,时序数据库越来越需要“云边端协同”——从边缘端到小型服务器再到云端进行协同,这样把数据真正组织起来进行后续分析,加强易用性。其次,时序数据库在云上还有“云原生”的趋势——把数据库服务做成上传的方式,真正让用户做到开箱即用。最后,时序数据库对AI的支持以及利用AI算法优化数据库的查询存储等相关过程也是另一显著趋势。

  对此,CnosDB未来首先打算接入更多生态系统——比如支持TensorFlow在CnosDB上做实时训练和预测,支持Prometheus、Grafana等监控系统;CnosDB希望通过生态协同,让各个组件厂商都能各司其职,以在市场里更好地为客户服务。

  更重要的是,并不是所有的软件产品或者系统都适合开源,但在基础架构领域的话,确实是应该参与到真正的开源过程——即不仅是开放源代码,而且是把自己构建产品的设计思路以及从0到1的体系全面地向大家展示,并且配合社区的活动把生态、人才和整个体系更好地建设起来。

  时序数据库的市场规模如何

  时序数据库目前跟传统的关系型数据库相比确实没有那么大的规模,大概是大几十亿到百亿的市场规模。但由于它在使用场景上对物理世界和虚拟世界的连通以及今后对 AI 的支持,其客户的体量在逐渐增长,在未来若干年可能成长为一个几百亿美金的市场,这也是为什么有很多的创业者选择了时序数据库作为创业方向。

  06

  时序数据库的技术路线之争

  不管是开源派还是闭源派,不论瑟吉欧原生的存储引擎还是嫁接了其他存储引擎的时序数据库,都应该以服务客户为宗旨。CnosDB在吸收和借鉴不同时间诞生的时序数据库厂商的经验后,选择了开源与采用原生存储引擎的路线。其实,怎样更好为客户服务、怎样提高产品的易用性和稳定性才是在同质化时代,时序数据库选型的首要因素。

  CnosDB的典型应用场景?

  首先,CnosDB适用于物联网、传感器监控等场景——包括储能、工厂泵机的监控与寿命预测等这些真实的用户场景。其次,CnosDB也帮助监控服务器和虚拟机,采集其上数据并进行相关分析和预警,还支持与Grafana等系统的集成。另外,CnosDB也适用于监控股票、基金等金融数据场景。

  客户如何选择时序数据库?

  稳定性和易用性是客户最看重的两方面。首先,因为时间序列数据连续不断、体量又大,数据库的稳定运作至关重要。另外,前端要支持物联网网关,后端要支持Docker、K8s等系统和分析工具,就对易用性提出了要求。易用性也是影响用户持续使用的首要因素。

  客户选型时序数据库的流程

  对于想要选用时序数据库的用户来说,首先要评估自己的服务器用量需求,再基于性能测试和压力测试等了解自身系统。在此基础上,选择易用性和稳定性更好的时序数据库,切忌一味的追求性能或者功能,这样最不容易出错。

1
相关文章