技术开发 频道

SACC 2013:大数据可视化应用及推荐

  【IT168 现场报道】2013年9月4日消息,由IT168、ITPUB、ChinaUnix主办的SACC2013第五届中国系统架构师大会在北京福朋喜来登酒店拉开序幕。大会将以“大数据下的IT架构变迁”为主题,邀请国内最牛的IT架构师与工程师们来分享他们最新的技术应用经验与成功案例。据了解,中国系统架构师大会自2009年首次召开以来,已经成功举办了四届,受到了业界的广泛关注和赞誉,并已经成为当前国内最高技术水准的架构师盛会。

  2013中国系统架构师大会将围绕“云架构、IT基础架构优化、大数据下的IT架构变迁”三个热点话题展开。吸引了来自全国各地的架构师、工程师、开发经理、DBA、运维总监、CTO等的参与,为期三天的大会议程包含了14个专场的主题探讨,给大家更宽裕的学习交流空间和时间。

  主题为大数据可视化应用及推荐的专场3中,Oracle ACE专家、恩墨学院院长侯圣文担任主持人,幽默机智的串联起整个会场。中国传媒大学新闻学院教授、中国传媒大学调查统计研究所所长沈浩,ENCORE技术总监郑保卫,人人网应用研究中心负责人、技术经理邓雄,天猫工程师、算法专家张奇分别担任四个主题的演讲嘉宾。四位专家均为数据分析和挖掘领域的博士,分享的专业性内容受到参会者的热烈追捧。

SACC 2013:大数据可视化应用及推荐

SACC 2013:大数据可视化应用及推荐
▲异常火爆的会场

  沈浩教授拥有二十多年的统计和数据分析经验,精通各种统计技术的分析方法,擅长数据挖掘、社会网络分析、多变量数据分析、市场研究定量模型、数据可视化。他认为看得见才能做得到,做得好!数据-信息-知识的转化不仅需要好的数据分析能力,还需要将发现的知识传播出去,数据可视化是数据洞察的重要手段和技术。如何发现数据应用之美,特别是在大数据时代,从数据可视化角度,借助数据科学和网络科学理论,诠释软件工具和应用案例的数据可视化、信息可视化和交互可视化的应用。

SACC 2013:大数据可视化应用及推荐
▲中国传媒大学新闻学院教授、中国传媒大学调查统计研究所所长沈浩

  他此次的演讲主题为“发现数据应用之美——数据可视化传播与应用”。数据可视化可以使数据变得更有意义,而且可视化也可以使数据变得更容易理解。数据可视化软件正帮助越来越多的企业从浩如烟海的复杂数据中理出头绪,化繁为简,变成看得见的财富,从而实现更有效的决策过程。很多企业在上了ERP之后,面对海量数据,难以分析,难以清晰的呈现,难以从中发现问题,企业管理者也很难从中找到决策之道。数据可视化工具能够以一种简便易用的方式将复杂的数据呈现出来,用户更容易理解这些数据,也就更容易做出决策。

SACC 2013:大数据可视化应用及推荐
▲Twitter在线可视化

  EN-CORE高级技术顾问郑保卫在韩国国立釜庆大学信息工学系获得工学博士,在韩国曾经参与过大量关于数据库建模、数据库性能优化,元数据系统构建等大型项目。此次他的演讲主题为“基于高质量数据仓库的数据分析”,分享了如何实现高效的数据架构,来确保构建出高质量的水坝型数据仓库,继而为商业智能、主数据管理、客户关系管理、报表等分析型系统提供高质量的数据源,最终确保数据分析结果的高效性和正确性。

基于高质量数据仓库的数据分析
▲EN-CORE高级技术顾问郑保卫

  随着大数据时代的到来,信息系统的焦点已从业务支撑,逐渐转向数据分析。随着市场竞争的日益激烈,企业面临的压力和挑战也逐渐增加。为了能够在激烈的竞争中立于不败之地,企业必然提出数据分析有关的需求,希望及时了解企业经营状况,提升客户关注程度,综合分析客户行为,全面掌握关系企业命脉的主要数据。 所有数据分析的数据源全部集中在数据仓库中,数据仓库中数据质量的高低直接决定数据分析结果的质量;而数据仓库构建方法的正确与否,又直接决定着数据仓库的数据质量和访问性能。

  郑保卫表示,一切数据分析的基础是稳定的数据架构。数据分析系统的构建战略包括五个方面:组织内部保持一致性;应用尖端技术,改变系统结构;核心数据领域的革新;先进的数据管理体系;通过EDW构建BI系统,最终保持先进性,走向国际化。

  人人网的邓雄是英国帝国理工数据挖掘博士,长期从事数据挖掘、社交网络、计算广告等方面的研究和实践。他的演讲主题为“构建人人网社会化推荐引擎”,分享了挖掘人人网社交图谱的实践,着重讲述人人网社会化推荐引擎的发展现状,主要是社交图谱与社会化推荐系统社会化推荐系统面临的重要挑战,人人网社会化推荐系统架构,人人网社会化推荐主要模型及算法及人人网社会化图谱挖掘的其他进展。

基于高质量数据仓库的数据分析
▲人人网应用研究中心负责人、技术经理邓雄

  人人网是中国社交网络的代表,它组织了一个超过2亿注册用户及超过1亿月登用户的巨型社交图谱,人人网中的推荐系统是基于大数据的应用。社会化推荐系统产生的背景就是信息爆炸和信息过载,给用户推荐符合其喜好的信息,如好友推荐、商品推荐、日志推荐、视频推荐、App推荐、广告推荐等。

  而社会化推荐系统有三个主要特征,信息特征、社交特征和流动性。信息特征即多样化,网状化,异构化实体;社交特性中社交关系是一种特殊的信息;流动性是指信息在社交网络中动态流动,加速增长, 充满噪声。

基于高质量数据仓库的数据分析
▲推荐系统的发展

  来自天猫的张奇(得福)毕业于中国科学技术大学计算机系,也是一位博士,他的演讲主题为“天猫个性化推荐架构”,分享了天猫推荐业务的特征和价值,整个天猫推荐的算法架构,在用户实时购物意图分析、在线CTR 预估、离线算法融合等等方面所做的工作。

基于高质量数据仓库的数据分析
▲天猫工程师、算法专家张奇

  天猫的推荐业务快速成长,已经成为天猫最重要的导购产品之一,覆盖了商品推荐、品牌推荐、活动推荐等等维度。天猫个性化推荐的目标是基于用户实时行为和天猫的导购路径结构,判断用户当前的意图。意图建模(三维模型)有三种方式,包括品牌意图、类目意图和单品意图。再进行特征刻画,即利用CPV、UIT 等数据刻画类目意图。

基于高质量数据仓库的数据分析
▲用户购物意图模型

  更多精彩请点击

基于高质量数据仓库的数据分析

2
相关文章