【IT168 调查报告】2012年,大数据成为绝对的焦点。数据对于企业而言,是一种重要的战略资产,谁能把握这一机遇并迅速行动起来,就能在未来的竞争中占得先机。管理咨询公司麦肯锡认为,数据逐渐成为重要的生产因素,人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。大数据将会创造一个新的经济领域,该领域的全部任务就是将信息或数据转化为经济利益。
在过去的一年里,大数据给IT业界带来新的活力,新产品和解决方案层出不穷。针对大数据时代的新机遇、新挑战,IT168近期展开大数据应用专项调查,目的是通过调查结果揭示大数据时代下数据管理与分析应用产生的变化。这里所谓的数据的管理与分析应用,具体来说就是数据库及其他数据管理软件、数据挖掘和数据分析产品,以及商业智能工具。
调查主要结论:
1.企业用户每月新增数据在500G以上的,占到所有被调查者的16.67%,新增数据规模还未达到企业无法掌控的程度。
2.企业用户认为当前最困扰的两个问题是数据读写瓶颈和数据类型多样化。
3.关于数据挖掘与数据分析应用,企业用户最担心的是分析不准确和分析速度慢。
4.Apache Hadoop的普及水平超出想象,其比例占到所有数据应用服务商的9.01%,排名第四。
5. 56.31%的企业用户对大数据的投入小于50万元,仍处于初级阶段。
6.大数据的部署还处在初级规模,潜力巨大,0-5个节点的企业用户比例为40.54%。
7.分布式存储与计算、内存数据库和云数据库成为用户最关注的三大新技术。
一、调查背景介绍
2012-2013中国IT技术趋势大调查活动于2012年10月16日启动,历经1个月的时间。在线调查期间,受到了来自ITPUB、ChinaUnix(以下简称CU)以及其它合作网站的网友的极大关注和积极参与。目前调查已经完满结束,所有的数据都在后台整理和统计之中。本次网上调查共回收调查问卷17,101份问卷,其中合格问卷为14,522份。从整体上看,今年的调查更专注,无论从数量上还是质量上都较去年有比较大的提高。
本次调查的内容涉及:企业信息化、桌面虚拟化、Hadoop架构、下一代防火墙、BYOD、IT运维和大数据应用等7方面的研究成果,这些将最终形成《2012-2013年IT技术应用趋势调研报告》,并将整合到《2012-2013中国IT应用技术蓝皮书》中,于2013年4月份第四届数据库技术大会上对外发布。
作为2012-2013中国IT技术趋势大调查活动的一个重要组成部分,大数据应用调查共收集有效问卷2221份,被调查者所属行业和企业规模如下图所示:
由上图可以看出,参与此次调查的用户几乎遍布了所有行业,其中人数最多的是三个行业是IT业、互联网和制造业,分别占到25.68%、20.72%和12.16%。其次是电信、金融、教育科研和医疗行业的用户,而零售、能源和物流的人群相对较少。
从企业规模来看,1000人以上的大中型企业占据主流地位,为总体被调查者的43.59%。而100-999人的中小企业,即上图中100-249人、250-499人和500-999人的总和更是超过被调查者总数的一半,小微型企业在本次调查中所占比例较少。
本次调查的主题是大数据应用。大数据从其概念上讲,包括四个关键特性,即海量的数据规模(volume)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)和巨大的数据价值(value)。作为最基础的数据规模,参与调查的人员所在企业每月新增数据规模如下图所示:
被调查者所在企业每月新增数据规模在0-10G的占到26.13%,11-100G的占到33.33%,101-500G的占到23.87%,500G以上的占到16.67%。从这个数字可以看出企业目前的数据增长规模不断上涨,但还未达到企业无法掌控的程度。每月新增数据规模在500G以上的用户多来自互联网和电信行业,传统企业数据增长量基本保持在500G以下的水平。
但未来数据的涨幅可能会受到社交网络和移动互联网的影响,非结构化数据的比例逐渐增加,导致总数据量的暴涨。根据IDC今年一项研究显示,未来10年全球数据量将以40%的速度增长,到2020年将达到35ZB(Zettabyte),其中80%为非结构化数据。然而这仅仅是个开始,未来数据量将达到什么级别,我们无法想象。