三、企业大数据应用现状及规划
大数据虽然刚刚兴起,但数据在企业中一直处于核心地位,传统的数据产品,如数据库、报表系统等,在企业中部署运行多年,为企业的经营决策贡献巨大。本调查对企业用户数据产品应用现状、大数据部署现状和规划进行摸底,首先来看一下企业现有数据产品的服务商排名:
由上图可以看出,企业现有数据产品的服务商,排在前六位的分别是Oracle(27.93%)、IBM(15.99%)、Microsoft(14.41%)、Apache Hadoop(9.01%)、EMC(8.33%),以及SAP(7.66%)。Oracle以绝对的优势拔得头筹,可见其在数据库、数据分析和大数据方面的地位。
值得一提的是Apache Hadoop的应用比例已达到所有被调查者的9.01%,排名第四。Hadoop的普及水平已超出我们的想象,成为继Oracle、IBM和Microsoft之后又一主流平台产品。但Hadoop不是功能较多的,其仍存在局限性,针对结构化数据的管理,还应选用传统关系型数据库及其他数据管理产品。
关于企业在大数据领域的投入问题,28.83%的被调查者选择20-49.9万元,27.48%的被调查者选择0-19.9万元,17.57%的被调查者选择50-99.9万元,即56.31%的企业用户对大数据的投入小于50万元。另外,150万元以上的只占13.96%。由此可见,企业对于大数据的投入仍处于初级阶段,并且以Hadoop和NoSQL为代表的大数据基础设施都属于开源产品,硬件方面也可使用廉价的PC服务器,所以投入并不高。
如前文所述,Hadoop、NoSQL这样的开源大数据解决方案能够节省资源、提高系统利用率,是性价比极高的选择。由上图可知,19.82%的企业用户正在使用开源大数据技术,22.97%的企业用户计划于1年内部署,9.91%计划于2年内部署,没有相关计划和不确定的人群占到47.29%。由此看出,Hadoop等开源大数据技术相当热门,已经有至少52.71%的企业用户已经或计划部署相关解决方案。
从被调查者所在企业考虑或已经部署的大数据节点来看,选择0-5个节点的为40.54%,6-10个节点的为22.07%,11-20个节点的为16.67%,21-50个节点的为10.81%,51-100个节点的为2.70%,而101个以上节点的为7.21%。由此可见,大数据的部署还处在初级规模,大多数企业还未部署,或部署少量节点。相信随着数据量的不断增加,大数据相关的节点规模会不断增加。