技术开发 频道

解读美网公开赛背后的高级分析技术

        【IT168 案例】译者按:喜欢网球的观众一定会注意到,在大满贯赛事直播中,总能看到那个扎眼的IBM Logo。没错,IBM与网球运动结缘由来已久,想必有很多球迷都已经体验过数据统计分析这一服务。但在今年的美网公开赛中,其实有更多背后的故事等待我们挖掘。

  每年的8月底9月初,都会有大批的网球迷涌向位于纽约皇后区的USTA国家网球中心,近距离观赏大满贯之一的美国网球公开赛。但对于那些远在大洋彼岸的中国球迷来说,想要去现场观看巨星风采的机会实在是太少了,即使是身在美国也不免会遇到一票难求的窘境。为了帮助广大网球迷无法到现场观看比赛的难题,美国网球协会(United States Tennis Association,USTA)决定通过线上网站的方式来为他们提供更好的体验和服务,这就是USOpen.org 。

  在美网进行的两周之内,网站将遭遇一年之内最高的流量压力。根据去年提供的报告数据,短短两周时间里 USOpen.org迎来了5100万次独立的用户访问。对于一个在互联网运维方面没有太多经验的机构,USTA承受了巨大的IT压力。更重要的是,USTA想要为用户提供更多的服务而不仅仅是一个提供简单日程和比分信息的网站,这其中还要包括一系列赛事图片、新闻报道、视频录像以及整个赛事的统计数据。

  在短短的时间里进行筹备并满足上述的需求,USTA不得不接触到许多新类型的数据并尝试使用更多的IT技术,比如云计算、高级数据分析以及移动技术。

  USTA新媒体高级总裁Phil Green在接受TechTarget记者采访的时候表示:“我们的目标就是成为网球运动甚至整个体育界的尝鲜者,因为美网公开赛将成为体育与大众娱乐的非常好的结合体。”

  高级分析需要更“干净”的数据

  USTA从5年前就与IBM公司进行了深度的合作,后者通过名为SlamTracker的应用软件为美网提供赛事数据统计,用户还可以通过在线面板来访问其中的数据。但相比于今年的需求,过去几年的数据还是属于最基础的数据,用IBM负责体育行业项目的技术负责人John Kent的话来讲,这些数据太“表面化(surfacey)”了。此外,数据共享也是一个问题,USTA无法获得其他大满贯赛事的数据,因为它们都被存放在各自独立的系统当中。

  Kent透露,在过去的几年当中,这些统计数据事实上都是存储在Excel表格当中的,其他体育媒体都只有比分的信息,我们想要更深度的信息。

  从去年开始,Kent和他的团队就计划深入挖掘数据的价值,并开始使用一系列的高级分析技术,包括实时数据更新、可视化和预测分析等,以便满足USTA的需求。根据IBM提供的新闻稿,这些技术都包含在SlamTracker软件的“Momentum”功能中,它可以标记球员的动作,并对比赛关键转折点以可视化的方式展现出来。

  Kent介绍,IBM还开始对过去7年的大满贯历史数据进行挖掘和清洗,对“决胜关键”进行建模,预测出每位球员最关键的三个决胜因素。为了实现这一目标,IBM团队必须对3900万个数据点进行分析。

  此外,美网官方网站还增加了社交媒体功能,而数据分析技术也第一时间进行了跟进。IBM对每一条发布的微博(tweet)都进行分析,从而能够判断出球员的受欢迎程度,球迷对特定场次的关注度等。

  云与移动化

  为了把每一条数据随时随地呈现给球迷,USTA还需要投入云计算和移动技术的怀抱。从2009年开始,USTA就发布了一些移动应用,从智能手机开始,到现在的平板电脑,今年USTA就针对iPad发布了一个专门设计的应用。

  Green说:“我们希望把移动平台的优势发挥到最大,所以你在PC上的体验与在iOS或者Android平台上是完全不同的,而且应用在iPhone和iPad上也会有所不同。”

  要达到这个细化的目标,IBM和USTA除了考虑最基本的平台特性,如屏幕尺寸之外,还深入研究了球迷在不同平台上的使用习惯。Green举例说,如平板电脑,用户习惯于一手托着设备一手进行操作,这和PC是完全不一样的。

  开发针对不同用户的移动应用对于USTA来说并不是最大的挑战,云计算才是。当Green谈到USTA对IBM产品时,他讲了一个有趣的故事。

  “去年,我们的的确确体验了一把‘云’”Green说:“飓风艾琳登陆之前,我们还听说那几天会停止电力供应。”

  IBM向USTA的人员介绍他们计划使用云计算技术来维持美网的线上服务,在飓风艾琳到达的前几天,USTA转向了云服务。

  目前,IBM使用1个私有云来对3个时区的3个站点提供服务,这与温网的设计有所不同。Kent介绍,IT环境被高度虚拟化,这使得IBM在系统发生故障时,能够将工作负载及时转移。

  “这已经不是故障转移这么简单,它更应该叫做故障避免机制。”Kent说。

  此外,弹性的云架构还使得USOpen.org网站能够随时扩展从容应对两周的高峰用户访问,在高峰期过后,还可以释放过多的计算资源以节省开支。

  原文链接:http://www.searchbi.com.cn/showcontent_65583.htm

0
相关文章