技术开发 频道

Hadoop在电信大数据业务系统中的应用

  电信运营商有哪些数据和服务?

  电信运营商整体网络结构大体是这样的:构建一张网络,有固定电话的网络、移动通讯网络、宽带的网络,这是跟每个消费者是密切相关的。电话的网络是拨打电话,宽带的网络,所有的移动互联网的行为都在宽带网络上都连接上了看待的网络,只不过目前运营商不知道,只知道用了多少小时、多少流量,移动网络也是同样。

  之前运营商构建了很多业务平台,比如中国联通有很多业务平台,提供短信的服务,以前提供短信服务运营商关注的点是业务提供好,用户可以开通、订购,把费用计算清楚就可以了。我们知道用了多少次短信,但是短信中有发给谁?有相关的内容的信息,这些信息运营商是视而不见的,理论上根据一个短信就可以构建一个社交关系的图谱,但是之前并没有做这件事。例如说采信、语音,当一个用户经常去拨打移动12580、11614也好,经常去拨打喜来登酒店,通过这些信息可以知道他有可能是个商旅的用户,甚至他拨打哪个酒店的电话可以区分出,他是低端的用户还是高端的商务用户,这些信息以前运营商是视而不见的,我们只是把记录记下来,之后做一次批价把钱收到了其他的信息都过滤掉了。

  还有云通讯录、位置服务,我们做移动互联网应用的时候,很多时候要打开位置服务,其实运营商可以知道你在什么时间、在什么位置,但是这些信息并没有搜集,很多的数据在我们的网络中但是我们没有用。例如说联通有沃阅读的业务,我们更关注谁去订购了阅读的业务,买了哪本书、花了多少钱,但是过程是怎样的,可能选购一本书之前浏览了很多相关的数据,这些过程的数据如果存储下来,其实就可以分析出很多用户的行为来。

  此外运营商开放的平台还有聚合类的和开放的业务。还有运营商的IT支撑系统,对普通人来说IT支撑第一是客户关系管理系统,客户的时候客户的信息、用户的信息、支付银行帐号信息都在客户关系管理系统中,运营商所有的产品的信息、套餐的信息也在,你是金牌还是银牌用户还是VIP用户信息都有。只不过之前并没有用过这些信息,消费行为的信息可以知道你是高端还是低端用户,这种信息现在显得更加宝贵。

  包括合作伙伴的信息在运营商中都有数据,还有综合计费帐目系统,以前做的事情是正确的算数给用户一份帐单,其实里面也蕴含大量的信息,以前的采集系统是采集的是话单,在大数据时代不光要采集一些计费的话单,也要采集用户使用业务中的所有的数据,可能包括上网记录的数据以及其他的数据,等等的数据,还包括网管的数据,例如综合资源管理系统,目前网络告警和监控的数据,内部ERP数据、办公自动化的数据等等,这些都是运营商拥有的数据。

  运营商拥有IDC,数据虽然是IDC的,但是如果能够在IDC的出口监测相应的流量也可以获得很多有价值的信息,上面构建了开放的平台,我们会把业务平台的能力,支撑系统、IDC开放出去,另外运营商也构建了应用商店,中国连通有沃商店等等,这上面也有很多用户行为的数据,还有第三方的应用还有终端和终端侧的数据,我们可以掌握现在用什么终端运营商的网络是了如指掌的,关键是搜集上来如何利用好。

  这么多的数据到底哪些是大数据呢?

  可能有些数据在现在来看,以前是大数据,现在来看并不算什么大数据,运营商有两类数据:一类是过程数据,例如说淘宝,最终在购买一个产品之前整个的过程发生了什么。现在虽然在用一次微信,但是其实对运营商的网络是很复杂的过程,在什么基站之下,运营商如何寻知你,上网过程发生了什么,整个数据对运营商来说都很重要。

  一类是移动网络数据域可以有用户上网数据记录数据和大量新的数据,可以知道为什么上不去网,为什么上网的速度很慢,现在的数据对运营商行为改善网络质量是有意义的。移动网络电路域语音数据,位置更新和网络测量的数据,这些数据是无时无刻不发生的,这个数据跟上网数量的数据是有过之无不及。

  移动网络网民的日志数据也是种大数据,再有是宽带上网记录的数据,宽带移动网络的流量目前占整体互联网流量是12%,如果采集宽带的数据至少是上网记录的数据十倍的量。运营商网络互联点,跟中国电信和国际互联点的数据都可以采集,这些都是采集的大数据。包括语音短信的详单,用户身份的数据,用户帐单和消费记录的数据,长久保留下来也是大数据。

  数据只有集中才能发挥最大的价值,目前有的数据是孤立在各个业务系统中的,在移动互联网的时代,运营商越来越被“管道化”,但是我们忽略了数据的宝藏,应该把数据集中起来,让数据发挥更大的价值,语音业务量会逐渐的减少,但是数据如果充分的利用好,就能够有更大的发展。

2
相关文章