【IT168 评论】全球Hadoop大会于11月8日在纽约成功举行。众多专家纷纷表示,Hadoop在面对多数据源的数据聚合与数据分析方面性能表现得十分高效,但也不能忽视由此带来的安全性风险。
在谈及Hadoop的安全性时,摩根大通的Hadoop专家表示,Hadoop在应对企业的海量数据分析时,表现得灵活自如。但也不能忽视Hadoop引入的一系列新问题,包括安全性,数据访问,数据监控,HA,业务数据连续性等各个方面。
这位专家透露,三年来,摩根大通一直致力于开源数据存储与数据分析框架的运用,并将其推广到银行欺诈侦测、IT风险管理、自助服务等诸多领域。作为开源框架之一,Hadoop主要运用在摩根大通的公用数据平台,用于数据收集与数据挖掘等商务智能分析。这些数据来源广泛,包括Web博客、银行交易、社交媒体等。
另一位Hadoop专家表示,当今数据呈爆炸性增长,主要体现在博客、社交网络、传感器、移动定位等诸多技术的广泛应用。由此带来的好处是显而易见的,企业能更加高效洞察和预见消费者行为以及行业趋势。
不过,该专家同时也表达了对Hadoop的安全性隐忧。他指出,如何保证这些海量数据的安全性,是企业必须面对的难题。要知道,不同的数据,按照安全级别,敏感程度,存在着复杂的类型划分,需要引入权限管理等访问控制机制。
该专家表示,Hadoop内置的分布式文件系统HDFS虽然支持ACL与Kerberos等安全特性,但还未能满足企业严格的安全性需求。因此,对于企业自身而言,需要自行实现合适的基于角色的安全访问机制。
该专家还指出,Hadoop在高效处理海量数据的同时,还触发了另一个安全性问题,即由Hadoop派生的新数据集也同样面临着数据加密的问题。Hadoop对数据的聚合增加了数据泄密的风险。相应地,Hadoop采取了一定的应对措施来解决这些安全性难题,比如,提供基于记录级的临时或中间数据加密方法。
另一位IT专家在接收eWEEK采访时表示,大多数公司都无法预见安全性漏洞,自然容易出现泄密。这里的“预见”指的是知晓“谁在掌控这些数据,以及谁正在使用这些数据”。为解决这一问题,许多公司都在使用LDAP等身份管理系统(IMS)来存储企业数据,可跟踪谁在使用数据,以及使用数据做什么。
实际上,面临Hadoop的安全性问题,人们反应不一。政府机构采取的是隔离Hadoop数据,引入角色管理,预防非法访问。像IBM、Yahoo、Google这些老牌的Hadoop厂商近年来也逐渐意识到Hadoop安全性的重要性,纷纷采取措施,积极应对。而一些对安全性要求相对保守的公司,干脆就放弃了Hadoop。