登录 / 注册
IT168技术开发频道
IT168首页 > 技术开发 > 技术开发评论 > 正文

小议阿里云"数加"平台对企业有何帮助?

2016-01-29 00:00    it168网站原创  作者: 老鱼 编辑: 覃里

  【IT168 评论】阿里云发布大数据平台“数加”,让DT时代不再只是阿里巴巴鼓吹的一个概念,而是实实在在的落地了!通过数据倒推本质,意味着一个新的时代来临,而这对企业和个人开发者又意味着什么?

  1月20日,阿里云在2016云栖大会上海峰会上发布了一站式大数据平台“数加”,工欲善其事必先利其器,首批亮相的就有多达20款产品,覆盖数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等数据生产全链条。

  阿里云大数据事业部资深总监徐常亮特别强调“这些技术至少领先业界三年”, 听起来“数加”似乎很厉害。那么这个平台到底有何技术优势?对于企业又有什么帮助?企业将数据交予“数加”,会不会导致信息外泄?肯定不少人都会有这样的疑虑。

  “数加”是什么鬼?

  “数加”出自阿里巴巴一个存在已久的团队:数据平台事业部,据说该团队比阿里云的历史还悠久,直到2015年初才变成了阿里云旗下的数据事业部。大家耳熟能详的ODPS、在云端、数据魔方、淘宝时光机、淘宝指数、TCIF、阿里妈妈DMP、全景洞察等都是出自这个团队之手。在“数加”之前,阿里巴巴内部实际上已经有两个大数据的平台,一个是面向集团内部的在云端,另外一个是面向外部电商场景的御膳房。这两个平台的底层技术组件基本是一致的。“数加” 实际上是在此基础上重新梳理租户模型构建起来的一套新实例。阿里巴巴对外推出的商用产品仍然是一贯的“由内而外”,这样的好处在于与单纯做产品的大数据公司相 比,胜在有场景,有需求,成熟度更高。 

阿里云“数加”平台对企业有何帮助?

  “数加”平台由三大部分组成:开发套件(含数据及应用开发套件)、解决方案、行业服务商。

  Maxcompute(原名ODPS)是“数加”底层的计算引擎。有两个维度可以看这个计算引擎的性能,1)6小时处理100PB数据,相当于1亿部高清电影。2)单集群规模过万台,并支持多集群联合计算。

  Analytic DB是实时多维分析引擎,可以实现百亿量级多维查询只需100毫秒。阿里巴巴内部很多面向海量互联网用户的产品的在线大数据查询,很大程度上依赖于Analytic DB。

  流计算(StreamCompute)具有低延时、高性能的特点。每秒查询率可以达到千万级,日均处理万亿条消息、PB量级的数据。

  “数加”对企业意味着什么?

  从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户“口味”的产品和服务,并结合用户需求有针对性地调整和优化自身,就是大数据的价值。

  一个企业使用数据越有效,它的潜力就越大,这是众所周知的真理。在过去的IT时代,虽然已经产生了大量的数据,但并没有很好的用起来!

  企 业要怎样才能用上大数据呢?要知道没有经过处理的数据是原始数据,是没有任何价值的。按目前国内企业的实际情况来看,谈论大数据的多,实际上有大数据的企业 不多,当然,使得上的大数据工具也不多。尤其是小企业不仅自身缺乏数据,自建大数据平台更是折腾不起。因此,在非常多的场景下小企业还是要依赖传统数据库 的统计手段。而且在专业人士眼里非常Low的Excel目前还是主流的数据分析工具。

  “数加”的发布显然降低了大数据的应用门槛。通过 “数加”任何一个企业、个人都能极为方便的进行大数据的开发和应用,最起码,从速度、成本、开发效率上,有很大提升。

  对于专业的数据服务提供商而言,还能通过“数加”对接服务市场,借助‘数加’上的工具为各行各业提供数据服务,实现能力变现。“就像淘宝开店一样,阿里云大数据事业部资深总监徐常亮表示,阿里云计划用3年时间吸引1000家合作伙伴入驻,共同分享1万亿的大数据蛋糕。

  无法否认,阿里巴巴已经成为了云计算、大数据领域的一面技术旗帜。对行业而言,阿里云推出数加这样的大数据服务,对大数据技术的推动无疑是巨大,因为大数据终于是看得见摸得着了!也让国内众多企业有了更明确的思考方向和技术参考,原来大数据还可以这样做。

  “数加”有何技术优势?

  在“互联网+”的大背景下,各个领域会涌现出大量视频数据、音频数据、图像数据、身体数据等,如何让这些数据算得快、算得准、算得起,是检验云计算技术创新能力的试金石。

  1、算得起

  会上,阿里云披露的测算数据:自建Hadoop集群的成本是数加的3倍多,国外计算厂商AWS 的EMR成本更是数加的5倍。典型案例墨迹天气。

  大麦网通过采用“数加”的推荐引擎,研发成本从900人天降低到了30人天,效率提升了30倍。

  2、算得快

  去年10月28日,Sort Benchmark在官方网站公布了2015年排序竞赛的最终成绩。其中阿里云用377秒完成了100TB的数据排序,打破了此前Apache Spark创造的23.4分钟纪录。在含金量最高的GraySort和MinuteSort两个评测系统中,阿里云分别在通用和专用目的排序类别中创造了4 项世界纪录。

  3、算得准

  “数加”承载了阿里巴巴EB级别的数据加工计算,经历了上万名工程师的实战检验。借助大数据技术,阿里巴巴取得了巨大的商业成功。通过对电子商务平台上的客户行为进行分析,诞生了蚂蚁小贷、花呗、借呗;菜鸟网络通过电子面单、物流云、菜鸟天地等数据产品,为快递行业的升级提供技术方法。

  数据交予“数加”安全吗?

  这个问题更直接的说法是,阿里是否会偷看或利用这些数据?其实从根子上而言,在于是否信任服务提供商?事实上,如今面对所有的互联网、电信、甚至线下的服务用户都需要回答这个问题并做出判断。总之,用户根据服务方所做的承诺和自己所能承受的风险做出判断就好。

阿里云“数加”平台对企业有何帮助?

  当然阿里云官方的回答是斩钉截铁的:不会!阿里云大数据事业部资深总监徐常亮强调,数据是客户的宝贵资产,任何云计算平台都不能移作它用。阿里云将严格遵守去年7月份发起的《数据保护倡议书》,也希望全行业能够自律,共同迎接大数据产业的爆发。

标签: 大数据 , 阿里云
  • IT168企业级IT168企业级
  • IT168文库IT168文库

扫码送文库金币

编辑推荐
系统架构师大会
系统架构师大会
点击或扫描关注
IT168企业级微信关注送礼
IT168企业级微信关注送礼
扫描关注
首页 评论 返回顶部