EN-CORE高级技术顾问郑保卫在韩国国立釜庆大学信息工学系获得工学博士,在韩国曾经参与过大量关于数据库建模、数据库性能优化,元数据系统构建等大型项目。此次他的演讲主题为“基于高质量数据仓库的数据分析”,分享了如何实现高效的数据架构,来确保构建出高质量的水坝型数据仓库,继而为商业智能、主数据管理、客户关系管理、报表等分析型系统提供高质量的数据源,最终确保数据分析结果的高效性和正确性。
随着大数据时代的到来,信息系统的焦点已从业务支撑,逐渐转向数据分析。随着市场竞争的日益激烈,企业面临的压力和挑战也逐渐增加。为了能够在激烈的竞争中立于不败之地,企业必然提出数据分析有关的需求,希望及时了解企业经营状况,提升客户关注程度,综合分析客户行为,全面掌握关系企业命脉的主要数据。 所有数据分析的数据源全部集中在数据仓库中,数据仓库中数据质量的高低直接决定数据分析结果的质量;而数据仓库构建方法的正确与否,又直接决定着数据仓库的数据质量和访问性能。
郑保卫表示,一切数据分析的基础是稳定的数据架构。数据分析系统的构建战略包括五个方面:组织内部保持一致性;应用尖端技术,改变系统结构;核心数据领域的革新;先进的数据管理体系;通过EDW构建BI系统,最终保持先进性,走向国际化。
人人网的邓雄是英国帝国理工数据挖掘博士,长期从事数据挖掘、社交网络、计算广告等方面的研究和实践。他的演讲主题为“构建人人网社会化推荐引擎”,分享了挖掘人人网社交图谱的实践,着重讲述人人网社会化推荐引擎的发展现状,主要是社交图谱与社会化推荐系统社会化推荐系统面临的重要挑战,人人网社会化推荐系统架构,人人网社会化推荐主要模型及算法及人人网社会化图谱挖掘的其他进展。
人人网是中国社交网络的代表,它组织了一个超过2亿注册用户及超过1亿月登用户的巨型社交图谱,人人网中的推荐系统是基于大数据的应用。社会化推荐系统产生的背景就是信息爆炸和信息过载,给用户推荐符合其喜好的信息,如好友推荐、商品推荐、日志推荐、视频推荐、App推荐、广告推荐等。
而社会化推荐系统有三个主要特征,信息特征、社交特征和流动性。信息特征即多样化,网状化,异构化实体;社交特性中社交关系是一种特殊的信息;流动性是指信息在社交网络中动态流动,加速增长, 充满噪声。
来自天猫的张奇(得福)毕业于中国科学技术大学计算机系,也是一位博士,他的演讲主题为“天猫个性化推荐架构”,分享了天猫推荐业务的特征和价值,整个天猫推荐的算法架构,在用户实时购物意图分析、在线CTR 预估、离线算法融合等等方面所做的工作。
天猫的推荐业务快速成长,已经成为天猫最重要的导购产品之一,覆盖了商品推荐、品牌推荐、活动推荐等等维度。天猫个性化推荐的目标是基于用户实时行为和天猫的导购路径结构,判断用户当前的意图。意图建模(三维模型)有三种方式,包括品牌意图、类目意图和单品意图。再进行特征刻画,即利用CPV、UIT 等数据刻画类目意图。
更多精彩请点击:
