【IT168 专题报道】10月21日下午,在SACC2017第九届中国系统架构师大会上的搜索及推荐系统架构设计专场中,来自58转转搜索推荐部负责人张相於为广大技术开发人员带来了主题为《C2C电商市场中推荐系统的挑战与机遇》的分享。
张相於,现任转转推荐算法部负责人,负责转转的推荐系统以及其他算法相关工作,曾任当当网推荐系统开发经理。多年来主要从事推荐系统以及机器学习系统的相关工作,也做过搜索、计算广告、反作弊等相关工作,并热衷于探索大数据技术、机器学习技术在其他领域的应用实践。
C2C市场及其特点介绍
演讲的开始,张相於首先对C2C市场及其特点进行了分析。他认为,C2C平台的意义主要有三个:物品交易、技能交换、发现世界。目前C2C平台可能还是以交易为主,但是它本质上是连接了个人与个人,前景会非常广阔。结合转转,张相於认为目前C2C市场的主要特点为:
·信息发布随意性强
·商品库存唯一性
·时效敏感性
此外,在C2C市场由于库存具有唯一性,这样就会导致好的商品不能推荐给更多的人。从这一点来看,C2C市场和新品电商以及资讯推荐都有很大的不同。
挑战与策略
张相於认为,目前在C2C市场,主要面临三大挑战:数据异质性高、时效敏感性、复杂策略下的性能压力。
数据异质性高主要涉及的是信息发布的随意性、结构异质性以及内容异质性。结构异质性包括结构信息少、结构信息不确定等问题,内容异质性包含信息量不确定、用词多样化以及歧义多等问题。
这些事实就会导致一些问题:结构信息少会使得策略难以制定;信息不确定会使得策略覆盖不全;歧义多使得策略准确率较低。由于结构代表着信息量,而算法好业务规则都可以根据结构化信息来制定推荐策略,例如“召回所有颜色为蓝色的长款羽绒服”这样一个策略里就用到了“颜色”和“款式”这两个结构化信息。但是如果商品的描述数据库中没有这样的结构化信息,只有一句“该羽绒服为蓝色长款羽绒服”的自由文本,那么就无法利用结构信息制定策略了。针对以上问题,转转团队提出了自己的优化方案。
数据异质性高应对策略:转转技术团队的解决方法分为两种,一种是将非结构化数据转为结构化数据,第二种是使用NLP相关技术直接处理和使用非结构化数据。
时效性应对方案:通过优化改造CF算法,构建统一画像管理系统,来将各种算法进行了实时化改造。
复杂性策略:通过对架构进行算能升级,实现了性能的提升了和计算能力的提升。
但是异质数据又有一些不可忽略的优点:
·数据量大。获取成本低,渠道少。
·多样性丰富。从内容上来讲是不设限的,理论上来讲,只要方法得当,相比结构化数据来讲,可以获取到更多有效信息。
·信息及时性。新词、热词的发现,微博、朋友圈圈,最快捕捉新信息
写在最后
在演讲中,张相於表示对于转转来讲,由于平台商品的唯一性,所以转转的个性化推荐要求会更高。转转必须拥有一个非常强大的推荐系统才能把新的商品不断推荐给用户。期待未来转转带给我们更多的惊喜!