触达场景下的智能化实践-数据库专区

触达场景下的智能化实践

作者：严选技术产品团队严选技术编辑：任朝阳 2023-05-23 09:55 来源：ITPUB

我们每天都会收到各种各样触达信息，就在这小小的信息里，蕴含了不少的智能技术。本篇文章介绍了严选触达场景下的智能化技术，包括人群、方式、创意、福利等因素的决策。

1. 背景

在《增长黑客》这本书中，作者介绍了如何使用低成本实现业务的爆发式增长。书中强调了触达在用户生命各个周期的有效作用。

针对处于不同生命周期的用户，运营策略通常拆分为引流拉新、促活留存、变现、流失、召回等。在策略执行的各个环节中，触达是不可缺少的抓手动作。

图：用户生命周期对应的各个环节

那么什么是触达?触达又包含哪些方式呢?

触达是通过信息的传递，刺激人们去采取行动。电商场景下，刺激用户的主要目标包括回访、购买和开会员。

图：淘宝的APP推送

图：淘宝的弹窗

触达的方式按照是否在主站内部展示可以分为站内和站外：

站内如弹窗、站内消息、首焦广告等;
站外包括站外广告、短信、微信公众号等。

根据发送的时机是否由用户动作来触发，可以分为主动触达和触点触达：

主动触达是指可以在某个时间主动给用户发送信息，例如主动给用户发送PUSH推送、短信等。
触点触达是指用户的行为或动作触发了触点，然后判断是否给用户推送信息。例如用户来到主站首页触发了弹窗，用户登录外部的APP触发了我们投放的广告等。

触达分类的四象限图如下所示：

图：触达分类四象限

2. 触达的要素

当我们要执行一个主动触达动作时，需要决策给谁触达、什么时间触达、通过什么方式触达、是否需要发放福利(如果发，发放什么类型多少额度的福利)、选择什么创意进行触达。这些内容构成了主动触达的核心要素，包括人群、时间、触达方式(又称触达手段、渠道)、福利、创意。

这里以双十一期间定金购商品“女式羽绒服”的触达为例，介绍各个要素的决策过程。

首先明确这次触达任务的目标是吸引更多的人下定金，为大促正式期蓄水。
人群包可以选择对钩子商品感兴趣的用户，如历史上访问过服饰类商品的女性用户。为了保证转化效果，也会加上活跃度的条件，如近期有回访的用户。
触达时间通常选择用户回访比较活跃的时间，如晚上10点。
触达的方式的选择也比较重要，PUSH推送没有成本，但是覆盖的用户量小。短信可触达规模大，但是有一定的触达成本，同时一些机型会默认屏蔽掉营销类短信。
蓄水期的规模影响到大促期的爆发，对于重要的场景更多选择短信的方式。
文案内容是触达中最重要的要素，通过测试发现，其他要素保持不变，仅内容不同，最后效果能有两倍的差别。

本次内容以商品作为钩子，突出价格和卖点(鹅绒材质、保温功能)两部分。

最后发送的短信文案为：“双11定金购「女式羽绒服」立省￥320!大毛领+90%白鹅绒，-30°不惧寒，戳> u.163.com/a/Fnvz”

触点类的触达需要决策在用户动作触发了触点后，是否需要进行干预，以及干预相关的要素如出价、内容等。以站外广告为例，当用户来到广告位的时候，需要决策以多少的价格参与竞价。

主动触达的场景，其要素通常是业务同学基于专家经验进行决策的，但是人工决策会存在一系列的问题：

触达的创意千篇一律，没有充分结合个性化实现效果的最大化。
需要耗费较多的人力进行配置工作。如上面定金购的例子，如果涉及上百种商品，则需要配置上百个任务。
人工设定任务优先级。上面的例子中，如配置了不同商品的触达任务，不同任务之间用户会重合，导致疲劳度约束下任务冲突，这时只能人工排定优先级，即增加人工量又降低了效果。
不同的触达方式没有协同，存在用户在不同渠道重复触达的情况，降低了用户体验，也降低了触达效益。

为了解决这些问题，同时提高触达效果和运营效率，我们尝试构建高稳定和智能化的触达系统，智能决策触达元素。

一期我们尝试了主动触达场景中的智能决策，即PUSH推送、短信、微信模板消息方式下各个因素的决策模型。

3. 触达系统

主动触达场景的触达系统分为两部分.：计划触达部分和实时触达部分。

计划触达部分需要提前配置好任务，系统根据任务生成触达计划表，并根据触达计划表定时执行任务(具体如下图所示)。

先生成触达计划是因为触达时间需要提前决策，并且福利决策模型、触达方式决策模型需要综合当天所有触达用户进行决策，而实时流处理方式不能满足需求，因此我们采用离线批处理的方式。

最开始的方式是每天凌晨生成当天的触达计划，但是一些业务同学会当天配置当天的任务。于是我们将系统迭代升级为准实时，每个小时更新触达计划。

图：触达任务的离线处理框架

实时触达部分解决的是临时性的紧急触达需求。在日常运营过程中，通常会存在临时性或者紧急的需要及时执行的任务，例如老板直播的通知、又如大促期间根据实时销售情况执行促转化的触达。这种情况下通常是指定人群、指定时间的任务，针对这种情形，我们也提供实时配置，及时触达的能力。

4. 智能化触达系统

智能化的决策系统，采用用户模型、决策模型、内容模型三种类型模型进行赋能，其核心是人群、时间、方式、福利、创意这五个核心要素的决策。

用户模型主要是对用户生命周期进行建模，处于不同生命周期的用户，其触达目标和频次会有不同。
内容模型提供素材内容的个性化能力，这部分主要通过实时服务提供能力。
决策模型主要是对触达方式(手段、渠道)和福利进行决策，通常需要基于预算约束对全局进行考虑。

5. 用户模型——触达人群的选择

给什么用户触达，需要基于我们执行触达的目的，不同的目标下会通过不同的方式来圈定用户。对于我们严选来说，触达的核心目标是促活、促转化、促开卡。

各种数据表明，用户上次访问至今间隔的时间越长，流失的可能性越大，因此需要保持用户粘性，维持用户活跃度。促活的目标主要是通过触达促进用户回访，该目标下圈定的人群主要是低活跃甚至流失的用户。这里构建了流失概率预测模型，预测未流失用户的流失概率，并选取高概率流失用户进行触达。而对于流失用户，则会保持默认的触达节奏。
促转化的目标下，圈定的用户是购买概率比较高的用户。这里我们构建了用户通用购买概率预测模型和用户商品购买概率预测模型分别对应人找货和货找人场景。人找货场景下，圈定购买概率高的用户，使用兴趣商品或者福利活动等钩子进行触达，踢好转化的临门一脚。货找人场景下，使用当前高优惠的商品，找到对这些商品购买概率高的用户，使用优惠和卖点作为利益点进行触达，促其转化。特殊情况下，例如大促期间，则会圈定所有用户进行触达，来冲刺流水。
促开卡场景下，我们构建了用户开卡预测模型，预测每个用户转化为pro会员的概率，还有会员续费预测模型，来预测会员继续续费的概率。根据不同概率进行人群划分，采用不同的策略和利益点进行触达。

用户模型采用相似的方法进行构建，考虑的用户特征包括用户基础标签、用户行为特征、用户订单特征、用户售后特征等，核心采用xgboost模型进行构建。

图：用户模型的主要模型(测试集上，购买概率预测的F1为0.91，会员续费概率预测F1可达0.97)

6. 内容模型——创意的千人千面

在触达所有要素中，创意内容是最核心的，内容的质量和吸引力对最终效果有很大的影响。创意的决策通常是在触达执行的时候，从用户可选用的创意文案(有时文案和福利会放在一起考虑)候选池中选取点击或转化概率高的文案进行触达，实现创意的千人千面。

现阶段创意的生产依赖业务同学，需要根据当前的时机，结合触达利益点进行加工。常用的利益点包括优惠力度、兴趣商品、商品卖点、社会热点、用户心理等，而且不同触达方式下对素材和字数的要求也不尽相同。

在我们当前的业务模式下，创意生产和任务配置是耦合在一起的，由运营同学负责生产，每次触达任务单独生产创意内容。这种方式下导致每个用户触达的时候，可用创意文案非常少，通常只有一两个可以选择，决策的空间和收益比较小。这种情况下，我们将创意内容拆分为模板加变量的方式，其中模板的数量是有限的，采用赛马的方法选择较好的模板，而变量采用个性化的方式进行填充，从而实现创意内容的千人千面。

6.1 模板赛马

在早期的创意生产中，业务同学会尝试生产多套文案内容/模板，各选取一部分用户进行测试，基于数据结果查看哪种文案的效果好，然后剩下的用户统一使用测试效果最好的文案进行触达。

模板赛马把整套流程自动化，提高操作效率，兼顾探索(exploration)和利用(exploitation)的关系。这里我们主要采用的是Epsilon-Greedy算法，初期流量随机分配到不同的模板上，当流量到达配置的要求后，大部分流量集中到使用效果最好的模板上，剩余小部分流量继续随机分配探索。

但是主动触达场景下的模板赛马存在以下问题：

相比于广告等实时反馈场景来说，推送和短信的反馈时间比较长，一些用户可能在发送几个小时后才有点击反馈行为，这导致赛马指标的实时计算存在一定的滞后性，所以适合长期的触达任务;
赛马未考虑个体的差异性，如宠物主题模版在所有模版中数据表现最好，后续便会主推这个模版，但并不是所有的用户对宠物感兴趣，因此更适合通用模版。

6.2 个性化变量

个性化变量根据每个用户的情况将文案中的变量替换为不同的内容，常用的变量如用户昵称、城市信息等，电商场景下重要的变量就是个性化商品变量、个性化活动变量、个性化福利变量(与福利决策一起使用)。

个性化商品变量选择用户感兴趣的商品来替换变量内容，触达场景里的商品推荐和首页猜你喜欢的商品推荐有所不同。猜你喜欢通常推荐多个商品，并在展示内容上比较丰富，有视频图片、卖点介绍、优惠信息等。而触达场景通常只推荐一个(或两三个)商品，而且展示的信息只有商品标题及少量文案，这就要求推荐的商品必须精准，用户强感知。我们对通用推荐的策略和流程做了调整：优化召回队列，提升交互行为商品队列的权重，降低探索性商品队列的权重;弱化精排和重排的作用，部分场景如新客触达则以粗排结果为主。

通过AB实验测试，相比于固定文案，添加个性化商品变量的文案可以提升整体转化率65.8%。需要注意的是，同一个变量在不同文案中多次使用的话，会引起用户疲劳，我们通过素材级别的疲劳度控制保证变量的内容不会重复。

图：含个性化商品的文案

6.3 商品标题改写

站外触达的核心方式PUSH和短信对字数的要求比较高，而严选的前台展示商品标题又特别长，如果直接将商品标题放到模板中，则很容易超过字数限制，同时较多字数也会增加用户阅读压力，从而无法引起用户的注意。因此我们对商品标题做了改写，满足字数要求的同时，增加对用户的吸引力。

图：严选的商品展示标题

首先我们重点做了标题缩写，把长标题缩写成核心短标题，基于NLP中的实体识别和语法分析，识别出核心商品实体词，如“洗感清爽不紧绷，清润茶语沐浴露”中的“沐浴露”。通过测试发现，对于一些商品(主要是常见商品)，标题缩写后会影响点击，因为缩写导致了商品卖点信息的丢失，相比于原来信息丰富的长标题，缩写后标题传递信息比较少。

于是我们进一步做标题改写，减少字数的同时保留核心卖点词，同时我们从评论中挖掘出用户关心的商品维度加以补充。评论的卖点挖掘采用下图所示的pipeline方法。先使用观点挖掘的方法识别评论中的观点维度和观点极性，然后对卖点进行聚合。在沐浴露的评论中，用户对于“泡沫”、“保湿”等维度关注比较多，我们把这些信息加入到标题中，将标题改写为“丰盈泡沫保湿沐浴露”。

图：商品标题改写的主要步骤

创意个性化后续的方向是将创意生产和任务配置解耦，提高创意生产的效率，增加创意内容的丰富性，提升个性化的增益空间。

7. 决策模型 - 核心要素的决策

7.1 时间的决策

触达时间的决策主要经历三个阶段，分别是：

第一阶段(整体的活跃时间)：这个通常是人工采用的方法，选择整体用户比较活跃的时间，如晚上10点。;
第二阶段(个体的活跃时间)：基于每个用户个体的活跃时间段进行触达。通过下图可以看出，除了睡觉时间，不同用户最活跃时间的分布还比较均匀。
第三阶段(模型预估)：综合用户活跃和历史点击情况对不同时间段的点击率或转化率进行预估。

由于历史的触达时间是人工选择的，主要集中在某几个时间段内，这导致沉淀的数据有偏，不能有效支撑模型预估的方法，因此我们先采用了第二阶段的方法，基于统计方法进行个性化。

初版模型中，我们统计每个用户不同时间段内的行为次数作为活跃度的度量，选取TOP的时间段进行触达。通过AB测试发现(对照组为中午12点，实验组10点-18点)，效果并不理想，点击率提升了3%，但是整体转化率下降了6%。

后面针对转化为目标的场景，对模型进行迭代，一是为不同行为设置不同权重，提高加购、支付行为的权重系数;二是区分大促和平销期、工作日和节假日。进一步的AB实验(对照组为中午11点半，实验组为9点至21点)数据表明，该模型对比对照组，点击率下降了0.52%，整体转化率提升了18.53%。

图：不同时间段活跃用户的分布情况

后续还会进一步迭代，尝试使用随机性触达时间来积攒一部分数据，便于构建机器学习模型进行预测。

7.2 触达方式的决策

现有站外触达方式主要有 PUSH推送、短信、微信模板消息和直邮。其中直邮的转化效果较差，微信可触达规模还很小(增长很快，后续会纳入一起决策)，因此一期重点考虑的是 PUSH推送和短信。每种触达方式都有自己的特点：

短信覆盖用户范围广，但是有不小的成本;
PUSH推送没有成本，但是有相当比例的用户关闭了推送。

不同用户对不同触达方式的感知也不一样，需要在有限预算费用下，个性化选择对每个用户效果好的触达方式。

触达方式决策主要分为两步：

预估用户在不同触达方式下的点击概率：

关于CTR的预估，我们没有采用机器学习的方法，而是统计概率方法，主要还是数据过于稀疏的问题。我们采用贝叶斯推断的方法进行求解，先根据用户群整体情况求得先验超参，再基于每个用户实际情况求似然函数，最后得到每个用户对每种触达方式的点击率的后验估计。

基于运筹优化方法决策触达方式：

采用整数线性规划的方法，单个任务的预算作为约束，点击用户数作为目标，构建线性规划模型进行求解。在只有短信和PUSH的情况下，该模型可以直接求解简化为对两种触达方式点击率差值的排序。在实际情况中，一般短信一天最多一次，而PUSH一天则发送很多，因此计算差值的时候，PUSH点击率需要乘以系数。

7.3 福利的决策

福利是电商触达场景下特有的考虑因素。各大消费平台也是通过红包或券的方式吸引用户转化，如美团、滴滴、拼多多、瑞幸等。

福利发放的主要思路有两种：

在平台上消费越多可以享受到更多折扣和红包，如酒店和航空的会员体系;
给不活跃或者转化可能性小的用户发放更大红包刺激其转化，常见如各平台新用户通常能拿到较低的折扣。

第二种方式常常被用户所诟病，由此可见，福利的决策不是简单的技术问题，还会涉及到政策、会员体系、用户心理等。

除了决策过程涉及到技术以外的方面，其技术本身也有很多难点：

一是数据的有偏和稀疏性。对历史福利发放数据和使用数据进行分析发现，数据稀疏性比较严重，如很多活跃用户没有收到过红包，或者只收到过很少的几种红包;同时也存在严重的有偏问题，统计发现40元红包的使用率远小于5元红包的使用率，是因为历史发放策略倾向给流失用户发放高额红包，这也导致数据的积累是有偏的。
二是指标的多样性。福利涉及核心指标包括转化流水、支付用户数、用户ARPU、ROI、回访率、使用率、人均使用成本、1UV价值、1成本增益等等。谈及哪个指标是最核心指标呢，大家通常“既要.. 也要..还想要”，这对建模造成了很大的困扰。当然，大家还是认为流水(有时是支付用户数)是最核心目标，而ARPU和ROI是基本约束。

我们尝试了不同模型，从不同的角度和思路来解决这些问题：

用户福利敏感度模型：预估不同福利下不同用户的转化概率，构建线性规划模型，转化为在成本、ARPU、ROI的约束下流水和支付用户数最大化的优化问题。
用户购买概率模型：预估每个用户的购买概率和消费水平，基于预测值给予不同的福利。
用户价值模型：基于毛利额的贡献对用户价值进行预估，高价值的用户给予相对高的福利。

同时也有考虑其他的思路，如uplift模型，通过福利发放对用户行为的变化进行建模，考虑数据问题和模型复杂度，而这次没有尝试，后面有机会可向这个方法迭代。

我们在同一人群、同一环境下，不同的模型进行PK，最后结果用户福利敏感度模型的支付用户数最高，用户价值模型的流水最高。最后结果也给了我们启示，维持好核心有价值用户的关系，其回报和价值更大。

最后采用的方法，我们放弃了复杂的端到端模型，而采用相对简单的方法：精准识别用户类型，再迭代发放策略。复杂模型的迭代成本很高，不能适应运营打法的快速变化，而简单模型迭代和调整更快。当然，简单模型也不简单，融合了不同的思路：首先会预估每个用户的价值度、购买概率和不同福利敏感度，再针对不同人群通过数据分析和测试来确定发放策略。

我们通过AB实验证明模型的有效性，相比于人工策略组，实验组支付用户数提升17.4%，流水提升5%。

8. 未来工作

触达的智能化方向还有很多工作可以做，更丰富的数据，更复杂的模型，未来可以深化的工作方向有：

创意级的个性化。提升素材和创意的规模，每个用户可以有丰富的创意可以选择，结合多样的变量，实现创意个性化的升级。
多要素综合决策。现阶段各个要素是单独决策的，实际上各个要素之间存在相互依赖，甚至会影响效果。例如，积分兑换活动下午6点结束，那么积分兑换创意的有效触达时间是早上10点至下午5点，假设某个用户的最佳触达时间是晚上10点，这时最优策略应该综合创意内容和时间等多个要素进行决策。
增益预估。现阶段模型预估的是用户回访概率或转化概率，而不是回访或转化的增益概率。以福利方法为例，假设用户A的转化概率是0.6，给予福利后可以提升至0.8，用户B的转化概率是0.2，给予福利后可以提升至0.6。假设只有一个福利的情况下(预算有限)，这个福利应该给谁呢。这取决于我们评估福利发放的衡量标准，如果以干预的转化率为指标，那么应该给A，如果以整个人群的转化率为指标，那么应该给B，第二种情况下则是考虑了干预的增益情况。
个性化疲劳度。不同用户对触达频率的容忍度是不一样的，那么对于用户一天到底触达几次是合理的，没有统一的认知，也许千人千面的疲劳度控制是个有趣的尝试。
不同触达方式的联动。不同的触达方式联动起来，如何合理的平衡重复触达和效果的关系也是值得探讨的问题。

9. 尾记

在《增长黑客》这本书中，关于触达的章节说到一句话让我印象深刻，“触达是效果最好但又常常被误用的策略”。通过触达可以和用户建立良好的关系，这需要为用户提供有价值的信息，也需要克制，寻求短期目标和长期用户价值的平衡。