数据库 频道

什么是分布分析?如何应用实践?

1846年,伦敦遭遇了惨绝人寰的霍乱灾难。当时,精英群体对霍乱传播途径持“空气污染说”的看法,而约翰·斯诺(John Snow)医生力排众议,认为霍乱的传播途径是被污染的水源。最后,事实胜于雄辩,政府通过控制被污染的水源,拯救了几万人的生命。

图一:约翰斯诺像

问题来了,约翰医生是怎么发现霍乱与水源之间的关系的呢?原来,他在研究过程中,统计了每位病亡人数,并在地图上标注出死亡案例的住所,形成了一张霍乱地图。通过分布分析,约翰医生发现,大多数霍乱病人的住所都围绕在Broad Street水泵附近。他结合其他证据得出:被污染的水源是霍乱的主要传播途径。

图二:伦敦瘟疫街区图

什么是分布分析?为什么它会这么神奇?

分布现象遍布我们的生活:大学时,老师给学生打的分数就是一种“正态分布”。这种分布意味着,大部分同学会得到一个中等分数,只有极少数同学获得较高分和较低分。

分布分析被应用到很多业务数据分析中,今天,壮实跟你唠唠:用户行为分析中的「分布分析」。

01用户行为分析中的「分布分析」

在用户行为分析中,分布分析是指:指的在划分的区间内,某个事件指标上的用户分布情况。它有很多种类:如按用户发生的事件频次分布、按属性值(维值)分布、按时间段分布等。

「按用户发生的事件频次分布」,就是按指标值划分区间,查看分布情况,如“拍照次数”的数值按1次/2次/3次……n次分布,各占比重多少。「按属性值分布」如:最近30天,全体用户的年龄分布情况;又如按金额分布,观察不同区间内的付费人数/次数分别有多少。「按发生的时间段分布」,就是在一定时间段内,按时间轴划分区间,观察在时间轴上的分布。

02

「分布分析」的主要价值

分布分析的价值,主要体现在以下几个方面:

全盘掌握用户属性分布,制定或优化策略

分布分析可以帮助我们全盘掌握用户属性分布, 重新制定或进一步修正策略。

我们可以通过分布分析看到全体用户/某一特定类别用户中新老用户、渠道、年龄、软件版本、操作系统版本的分布情况,从而整体上了解产品用户的构成及其特点,并根据这些情况更新策略。例如,产品的使用人群主要为20-35岁的女性用户,那么我们产品设计、运营和市场营销等多种策略都应该结合20-35岁的女性群体特征。

  • 快速识别用户偏好,资源配置有的放矢

通过分布分析,我们可以快速识别用户偏好,进行更好地配置资源,以最小成本实现企业利润最大化。

以淘宝为例:淘宝通过分析用户活跃时段的分布发现,22点-24点是用户刷淘宝的小高峰;进一步分析该时段用户购买的商品品类分布得知,用户在这段时间内下单购买的主要商品是食品。

这些分布数据,为淘宝“二楼”版块的提供了运营依据。用户在淘宝首页进行下拉动作,即可进入淘宝“二楼”,“二楼”的名字也缘自于此。淘宝将二楼的开放时间设定在夜间,它主要运用画面精良的视频形式,深度讲述商品故事,进行销售的转化。同时,淘宝二楼根据用户夜间多购买食品类SKU的习惯,还推出了一档名为《一千零一夜》的“治愈系食品”主题栏目。

  • 把控分布情况,找到产品改进方向

举个例子,在短视频产品上线后,大盘数据显示,用户在该产品内的视频观看时长较行业水平来说有较大差距。

问题出在哪儿呢?运营人员对用户观看视频的个数进行了分布分析,即观察每日观看1个/2个/3个/4个/5个……n个视频的用户各有多少人。分析后发现,有50%的用户只观看了1个视频(需要注意的是,观看视频并不等于看完视频),这一数据有明显的异常(想想看,你打开某音某手的时候,会只看一个视频就关了吗)。

经过排查后,运营人员发现,问题出在视频加载接口上——用户在视频观看的过程中经常会出现加载错误,无法正常观看。通过分布分析,我们找到了产品需要紧急修复改进的问题。

03举例:通过分布分析,优化产品策略

以电商场景为例。在电商场景中,影响其业务增长的因素有很多,如:访问用户数、转化率、订单金额 、复购率等。

如果我们想要提升成交总额,就要从这些指标入手进行优化逐个击破。

如复购率,我们可以通过“支付订单成功次数”分布分析。我们发现,该电商平台用户支付订单成功的次数集中在 0-1 次之间。这种情况低于行业平均水平,所以“复购率”成为成交总额增长的关键点。

同样,电商产品经理还会希望了解:

  • 最近一周用户浏览商品详情页的次数分布,例如 1次/2次/3次……n次的用户量分别是多少;

  • 最近一周支付订单金额分布,例如:100 元、200 元、300 元的用户数量分别是多少;

通过分布分析,产品运营同学就可以结合数据,优化产品策略,最终辅助成交总额的提升。总之,分布分析能让我们更快地发现规律,获得洞察。无论你是产品、运营还是市场的同学,分布分析都是一把数据分析的利器。

0
相关文章