技术开发 频道

率先以GPU加速数据库 MapD核心技术开源

  【IT168 资讯】MapD Technologies是提供GPU加速数据库的公司,近日宣布开放其MapD Core数据库。该公司正在向开源社区提供项目,并将其代码放在GitHub的Apache 2许可证下,以培育新一代的数据应用程序。

  该公司在一份声明中表示:“MapD率先使用图形处理单元(GPU)来以毫秒为单位来分析数十亿行的数据,比传统的基于CPU的系统快。 “通过开源MapD Core数据库和相关的可视化库,MapD正在为所有人提供世界上最快的分析平台。”

  在博客文章中,公司创始人兼CEO Todd Mostak为开源提供了更多的建议。“我们这样做首先是对开源软件变革力量的信念。无论是在Hadoop还是深入学习的生态系统中,开放源码都带来了巨大的创新。”

  该公司还宣布其免费的社区版软件,用于非商业开发和学术用途,包括MapD Core和MapD Immerse可视化分析客户端。该公司还推出了MapD分析平台企业版,该版本增加了MapD Core GPU渲染引擎以及未包含在开源版本中的分布式扩展,高可用性功能(如LDAP和ODBC)。

率先以GPU加速数据库 MapD核心技术开源
▲MapD Analytics生态系统

  NVIDIA公司DGX系统公司总经理Jim McHugh说:“MapD决定开源其核心数据库是非常重要的,因为它将进一步激励已经在行动的GPU分析社区。预计MapD的这一举措,使数十万GPU开发人员能够尝试数据库加速并构建新的GPU加速应用解决方案。”

  MapD被视为年轻的GPU数据库市场的领导者,并与Kinetica,BlazingDB,Blazegraph和PG-Strom等公司竞争。

  在2015年的一篇文章中,SQream Technologies试图解释GPU在数据库处理中所带来的好处。由于其结构,与通常具有较小规模的SIMD实现的通用CPU相比,GPU使得能够在巨大的数据块(SIMD,单指令,多数据)上执行单个“指令”。

  如果打个比喻,GPU可视为投币式压机,可以从一张金属板上冲出100枚硬币,而一枚CPU则是一枚硬币冲压机,可以一次从金属条上冲出10个硬币。这是GPU和CPU之间的关键区别。GPU是面向吞吐量的,而CPU是面向延迟的。因此,GPU非常适合同时对大量数据执行相同指令的操作。

  能够克服这些相关挑战的公司可能会获得巨大的市场机会。据外媒报道,“GPU加速数据库的新兴市场将有一场军备竞赛,赢家将是能够扩展到最大的数据集,同时成为提供与行业标准SQL相融合的赢家。”

  Github地址:https://github.com/mapd/mapd-charting

0
相关文章