0 前言

突然发现,之前所学习的内容的核心都在于如何将数据可视化,这一点是重要的,不过分析数据的进程可以往前进一进,往分析走一走,一直听说AARRRR模型,A/B测试啥的,这一篇博客就是围绕业务分析思维的,宝贝们,可以用于面试滴~希望对你有帮助!

这篇博客主要是通过一个案例,学习 OSM 框架 + AARRR 模型进行异动分析并归因定位,找到异动原因。

预告一下,下一篇博客会详细介绍在搭建指标体系、找到原因后,如何进行实验确认原因是正确的,并提出相应的解决措施。

接下来博客会进行详细的介绍。

1 作用

首先,我们需要明确一下数据分析师的职责。

数据分析师的核心:

  1. 用数据讲故事
  2. 用逻辑做决策
  3. 帮业务找到“为什么”和“怎么办”

我真心觉得数据分析师好牛,把一堆看似毫无价值的数字,进行清晰、筛选、可视化,就能从中挖取价值,一种变废为宝的感觉。

2 案例

通过具体的一个案例来学习相关业务——"快购"业务。这项业务出现了一些问题:用户注册量增长停滞并且新用户次日留存率突然下降10%,于是提出了我们的业务目标:提升新用户规模和质量。

新用户规模可以理解为用户越多越好,质量很好理解,就是希望用户留存率高,留存下来的用户。

  1. 问题:
    · 注册量增长停滞;
    · 新用户次日留存率突然下降10%。
  2. 业务目标:
    提升新用户规模和质量(增长&留存)
新用户次日留存率=次日仍活跃的首日新增用户数 ÷ 首日新增用户数×100%

举个例子:
4月21日,新增了 100 个新用户
4月22日,有 15 个人又打开/使用了产品
那么,新用户次日留存率 = 15÷100×100% = 15%

在使用任何数据之前,都需要保证数据是正确的,即数据验证,另一方面,每一项概念的定义需要保持一致,不能业务部是这个意思、运营部是那个意思,拥有标准的统一规范。

因此,需要统一统计口径,标准化概念。

关键点说明:

  1. 统计口径必须统一
    · 只算当天首次注册/首次启动的用户
    · 老用户回流不算新用户
  2. “次日”怎么算
    一般指:
    ·首日:T 日
    次日:T+1 日(自然日/24消失,看产品规则)
  3. “活跃”怎么定义
    不同产品不一样,常见:
    ·打开APP/进入小程序
    ·完成登录
    · 完成某个关键行为(下单、发帖、看视频等)

3 指标体系

指标体系搭建是数据分析师工作过程中比较常见的场景,也是面试的“必考题”!

指标体系的作用:

  1. 衡量健康度:用关键指标来判断现在的运行环境是否健康,使得健康程度得以量化。
  2. 定位问题:指标异常变化能够让我们定位问题出在哪个环节。
  3. 评估效果
  4. 统一语言:A 从 B 角度说可以,B 从 C 角度说不行,因此需要统一的语言来定性。

核心思想,找到与目标最紧密相关的几项指标,找到数据的异常变动,顺着数据发掘出现变动的原因,进行异动分析,归因定位,接着根据原因,提出相应的解决措施。

4 如何搭建指标体系?

前文,了解到指标体系是基石,是非常关键的分析环节的参考数据,那么,如何搭建合理高效的指标体系,需要用到 OSM 框架 + AARRR 模型搭建指标体系。OSM 框架是指标体系的“骨架”,AARRR 模型是“血肉”,两者结合起来构成整体的指标体系。

4.1 OSM 框架

· OSM用来搭建框架
在这里插入图片描述

  • Objective 目标:最终想达成的目标。
  • Strategy 策略:为了达到目标,从哪些方面努力,这就需要拆解用户旅程了,AARRR 模型来解决这个问题。
  • Measurement 度量:针对每个策略,用什么具体指标来衡量效果,进行量化分析。

连接"快购"案例分析:
O:提升新用户规模和质量;
S:使用 AARRR 模型分析;
M:具体指标。

4.2 AARRR 模型

此模型又称为海盗模型,对用户旅程进行拆解。她把用户从接触到成为忠实用户的过程,分成了 5 个关键阶段,使用此模型拆解"快购"新用户的旅程,并找到每个阶段的“度量指标”。

那是不是每个阶段我都一定要有度量指标呢?后文会有解答,往后面看哟?

这 5 个关键阶段分别是:获取、激活、留存、变现和推荐。

  • Acquisition 获取:怎么让更多人知道"快购"并注册?
  • Activation 激活:注册了,怎么让用户快速体验到"快购"的核心价值观?如何让用户使用“快购”?
  • Retention 留存:怎么让用户第二天、第七天、第三十天还愿意回来?比如我购物经常用淘宝。
  • Revenue 变现:怎么让用户开始花钱?
  • Referral 推荐:怎么让新用户愿意分享"快购"给朋友?
OSM目标 -> AARRR策略拆解 -> 具体指标度量

通过此链条模式,搭建完整指标体系。

Acquisition 获取

策略:如何让更多人知道“快购”并注册?
具体措施:

  1. 投广告(抖音、B 站、应用商店的开屏广告)
  2. 做裂变活动(邀请有礼)
  3. 优化注册流程

通过什么数据来判断有更多用户注册“快购”了呢?这时候就需要度量指标了。

度量指标:
· 新用户注册数核心!衡量规模
· 各渠道注册转化率:点击广告的人里,有多少成功注册了?衡量渠道效率
· 获客成本 CAC:拉一个新用户花了多少钱?衡量投入产出比。面试加分点!

连接“快购”:
注册量增长停滞?先看这几个度量指标,是哪个渠道不行了?还是注册流程太复杂导致转化率低?

CAC = 某段时间内的总获客花费 ÷ 同期通过这些花费带来的新客户数

Activation 激活

策略:注册后,怎么让用户快速体验到“快购”的核心价值?
具体措施:

  1. 新手引导
  2. 首单大额优惠券
  3. 个性化推荐
  4. 热门商品展示

度量指标:

  1. 新用户注册后首日核心行为完成率:超级重要!!!比如:
    · 浏览商品 > 5 的用户占比?
    · 加购用户占比?
    · 完成首单用户占比! 激活的黄金指标!!
  2. 新用户首单转化时间:从注册到完成首单的平均时间,越短说明激活效果越好

连接“快购”:
次日留存率低?很可能激活没做好!用户注册了,但啥也不干,或者没有体验到价值,第二天自然不想来。

Retention 留存

策略:怎么让用户第二天、第七天、第三十天还愿意回来?
具体措施:

  1. 个性化推送
  2. 签到积分
  3. 会员体系
  4. 复购券
  5. 优化商品/内容

度量指标:

  1. 次日留存率:当前核心监控指标!(注册日D0,D1日活跃即算留存)!当前重点监控指标
  2. 7日/30日留存率:看长期粘性
  3. 留存用户活跃度
    如:平均访问时长、访问次数,衡量用户参与度

连接“快购”:当前最痛的点!
次日留存率降了10%?这就是咱们要重点拆解的“异动”!后面异动分析环节就靠它了。

异动:异常波动

Revenue 变现

策略:怎么让新用户开始花钱?
具体措施:

  1. 首单优惠
  2. 复购激励
  3. 交叉销售
  4. 提升客单价

度量指标:

  1. 新用户首单转化率:和激活有重叠,但更侧重付费
  2. 新用户首单客单价:衡量新用户首次消费金额
  3. 新用户首月复购率:衡量新用户重复购买意愿
  4. 新用户生命周期价值 LTV:一个新用户从注册到流失,预计能给“快购”带来多少总收入?面试高分点!
LTV  >  CAC:赚钱
LTV  ≈  CAC:不转不亏
LTV  <  CAC:拉一个亏一个
行业通用健康标准:
LTV : CAC  ≥  3 : 1

连接“快购”:
留存率低,LTV 肯定受影响,提升留存是提升LTV的基础。
##e# Referral 推荐
策略:怎么让新用户愿意分享“快购”给朋友?
具体措施:

  1. 邀请有礼(双方得利)
  2. 分享得积分/优惠券

度量指标:

  1. 新用户分享率:注册用户里,有多少人分享了链接/海报?
  2. 邀请注册转化率:被分享的人里,有多少成功注册了?
  3. K因子 K-Factor:平均每个老用户能带来多少新用户?面试加分点!K>1说明能病毒式增长。

K因子 = 一个用户能带来多少个新用户,也叫病毒系数,用来衡量产品自传播、裂变能力有多强。

  1. 计算公式:
    K = 邀请发送数 × 邀请转化率
  2. K因子代表什么?
    · K < 1:传播会慢慢衰减,最后停掉,靠花钱买量才能增长。
    · K = 1:一个用户带来一个新用户,刚好自我维持。
    · K > 1:裂变会指数级爆发,用户自己滚雪球增长,就是传说中的病毒式增长。

连接“快购”:
如果新用户体验好,推荐是最低成本获客的好途径。当前阶段可能不是重点,但体系里要有。

4.3 面试场景模拟

跟着 OSM+AARRR 框架,分三步走,逻辑清晰!

请为“快购”APP的新用户增长与留存搭建一套核心指标体系

  1. O:定目标——懂业务
  2. S:拆策略——使用AARRR用户旅程串起全链路

· 获取:各渠道注册转换率、新注册用户数
· 激活:首单完成率
· 留存:次日留存率(当前重点)
· 变现:首单转化率、首单客单价、LTV
· 推荐:新用户分享率、邀请注册转化率

  1. M:定指标——抓重点,别堆数据

· 最高优先级指标:次日留存率(当前紧急)
· 北极星指标:新用户 30 日留存率或首月LTV(长期)

· 北极星指标(North Star Metric)是业务的“命门指标”,是唯一一个能代表“业务成功了”的指标。
· 它不是短期指标,而是能反映长期价值的核心指标,能够指导团队方向,避免被短期波动干扰。

连接“快购”:
· 北极星指标:新用户 30 日留存率
因为新用户注册量可能刷量,次日留存率是短期指标,波动大。30 日留存高的用户,大概率会复购、会推荐,长期 LTV 才高!

4.4 Q&A

  • Q1:AARRR 五个环节都要监控吗?会不会太多?

不用!当前阶段抓重点,比如“快购”现在重点是“留存”,那就紧盯 AARRR 里的“激活”和“留存”,其他环节可以先简化,等业务稳定了再补全。

  • Q2:北极星指标和核心指标有啥区别?

北极星指标是“唯一最重要的战略指标”(比如30日留存),核心指标是“支撑当前目标的几个关键指标”(比如次日留存、首单转化率)。北极是指方向,核心指标打仗!

  • Q3:如果业务目标不清晰,怎么搭指标体系?

找业务方聊:“老板,您觉得新用户业务,最重要的是什么?是拉新?还是留存?”,只有目标对齐了,指标体系才能搭对!

5 异动分析

什么是异动?
数据指标发生了超出预期的、显著的波动。

异动分析是数据分析师的日常工作之一,面试的高频考点

异动分析典型场景:
“快购”新用户次日留存率昨天突然从 40% 暴跌至 30%。

5.1 数据验证优先

异动分析第一步,特别是面试第一步,永远、永远、永远不是拆维度找原因,而是验证数据本身是否正常!

  1. 数据是否正常产出?
  • 数据管道通不通?
  • 埋点代码挂没挂?
  • 计算任务跑没跑?
  • 日志全不全?

· 埋点代码,就是写在 APP/网页/小程序里的一小段代码,用来“偷偷记录用户做了什么”。

· 举个例子:比如做了一个按钮“立即领取”:
· 没埋点:只是知道有人点了,但不知道是谁点的、点了几次、从哪里来的
· 加了埋点代码:后天立刻收到一条日志
用户 ID=123,在首页,点击了立即领取按钮

然后就能算出:按钮点击率 = 点击人数/页面访问人数

  1. 数据口径是否发生变更?
  • 指标的定义有没有被偷偷改过?
  • 指标的计算方法有没有变化?
  • 指标的统计范围有没有调整?
  • 口径一变,指标自然就变了!

5.2 异动分析完整流程

数据验证优先!只有确认了数据本身是靠谱的(正常产出+口径一致),才能开始真正的业务分析!
异动分析的完整流程如下图所示:

定义问题 -> 数据验证 -> 维度拆解 -> 原因假设 -> 实验数据验证 -> 根因定位
在这里插入图片描述

步骤一:定义问题

场景背景:
新用户次日留存率暴跌10%

步骤二:数据验证

  • 第一优先级:数据产出检查

找数据团队同事:任务跑成功没?日志全不全
确保任务成功跑了,日志量级也正常,数据产出没问题!

  • 第二优先级:口径确认

找产品经理:最近“次日留存率”或者“活跃用户”的定义改过没?统计范围有调整吗?
确保口径没问题!

结论:数据本身是可信的!这10%的下降是真实的业务异动!咱们可以开始拆维度了!

步骤三:维度拆解

维度1:时间维度

查看这 10% 的下降发生的时间段。

在这里插入图片描述

维度2:用户维度

哪个渠道拉来的新用户留存崩了?抖音?应用商店?B站?(分渠道看留存率!)

在这里插入图片描述

问题主要出在昨天下午2点到晚上10点,通过抖音广告渠道注册的新用户身上!他们的留存率暴跌了13%,拉低了整体。

维度3:行为维度

这些抖音新用户,是首日行为有变化吗?比如完成首单的比例?浏览商品数?

在这里插入图片描述

抖音渠道新用户留存暴跌,直接原因是他们首单转化率大幅下降!很多人注册了,领了券,加购了,但最后没下单!

步骤四:原因假设

基于拆解结果(特定时间段 + 抖音渠道 + 首单转化率暴跌),提出具体假设:

    1. 广告/落地页问题(最可能!)

昨天下午 2 点开始,抖音渠道投放的广告素材或落地页发生了变化!比如:素材夸大宣传,落地页商品与实际不符,或者落地页加载慢、有 Bug,导致用户预期落差大,虽然领了券加购了,但最后支付环节放弃。

    1. 优惠券问题

昨天抖音渠道新用户使用的首单优惠券,在支付环节大面积失效或无法使用?(可能性较低,因为领券率还高了。)

    1. 商品/库存问题

落地页推荐的核心商品,在昨天下午时间段大面积缺货或价格异常上涨?(需要验证)

步骤五:数据验证

  • 怎么验证假设1?立即找市场和运营团队!

· “抖音广告素材/落地页昨天下午2点后有没有更新?版本号是多少?”
· “检查昨天抖音渠新用户在支付环节的失败日志,看是不是集中在‘优惠券无效’、‘商品不存在’、‘价格不符’这些错误上”
· “分析抖音渠道新用户首单失败的具体原因分布。”

  • 模拟验证结果(根因找到!

· 市场团队确认昨天下午2点上线了新的“9.9元包邮”爆款广告素材和落地页。但后台数据显示,该爆款商品库存不足,大量用户点击后显示“已售罄”或“补货中”,导致支付失败率飙升!

步骤六:根因定位

  • 最终根因

· 市场团队确认昨天下午2点上线了新的抖音广告素材和落地页,主打“9.9元包邮爆款”,但该商品库存准备不足,导致大量抖音新用户在支付环节因商品缺货而失败,首单转化率暴跌,进而导致次日留存率大幅下降。

5.3 本章小结

完整分析流程:
数据验证优先 -> 维度下钻定位范围 -> 行为分析找到关键点 -> 业务假设验证根因

6 知识点补充

6.1 统计显著性

统计显著与否?下降10%是真的有问题,还是纯属运气不好(随机波动)?

面试话术:
对于 10% 这种大幅下降,在用户基数足够大的情况下(比如日活百万级),可以初步判断为显著异动,需立即排查,但如果波动很小(比如1%),我会用假设检验验证统计显著性,避免误判。

!!!大波动直接行动,小波动用统计方法验证!

6.2 对比分析

异动 = 对比 + 维度拆解
  • 时间对比

· 环比:昨天 vs 前天
· 同比:上周三 vs 本周三

  • 分组对比

· 渠道:抖音 vs 快手
· 版本:新页 vs 旧页
· 用户群:新用户 vs 老用户

6.3 辛普森悖论 & 常识判断

  • 辛普森悖论

· 经典案例:平台整体留存率下降,但拆开看每个渠道留存率都上升?
· 原因:用户结构变化(比如低留存渠道用户占比激增)
在这里插入图片描述

· 拆维度时一定要看分组数据!否则可能被表面数据误导,比如以为整体变差,其实是流量结构出了问题。
避免辛普森悖论三句话:

  1. 不看总数,看分组
  2. 不看简单平均,看加权
  3. 不比混乱结构,比同批次、 同结构
  • 常识判断

终极心法:流程是死的,人是活的!
如果抖音日活单日暴跌40%,第一反应不是拆维度,而是:数据肯定挂了!
面对极端异动,会优先验证数据链路(埋点、计算、存储),再谈业务分析——体现经验值!

  1. 抖音这种体量的产品,日活6亿+级别,正常波动 ±1%、±2%,大波动 ±5% 已经很夸张了,单日暴跌 40%,即直接少掉 2 亿多日活,现实中根本不可能发生,因此这种幅度的下跌,违背常识、违背业务逻辑,肯定是数据埋点、接口、统计服务、日志上报崩了
  2. 什么是数据挂了?
    · 埋点代码崩了,用户行为没上报上来
    · 日志队列堵了,数据延迟/丢失
    · 数仓任务失败,当天数据没算出来
    · 服务器宕机、接口报错
    · 统计口径被人误改了
    · 测试数据混进线上
    结果:不是用户少了,是你“数不到”用户了。

6.4 Q&A

  • Q1:如果数据验证发现口径变了,但业务方不承认怎么办?

拿出历史数据、指标定义文档、变更记录,用数据说话,必要时升级沟通。

  • Q2:维度拆解,先拆哪个维度最好?

没有绝对顺序,通常按业务相关性数据可得性。用户渠道、行为往往是最高优先级。时间维度看趋势也很重要。

6.5 本章小结

“诊断”部分的核心:

  1. 流程铁律:数据验证优先!(产出正常+口径一致)再谈业务分析;
  2. 分析利器:维度下钻!(时间、用户、行为)定位问题范围;
  3. 关键抓手:对比分析!(环比、同比、分组)找出差异;
  4. 心法提醒:统计显著性、辛普森悖论、常识判断!避免踩坑;
  5. 终极目标:定位根因!用数据讲清楚“为什么”。

7 后记

如果本篇博客对你有用的话,点个叭!

笑死我了,我去查阅为什么 AARRR 模型又称为海盗模型,原来是因为这个模型的发音类似电影中海盗的经典口头禅 “Arrr!”。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐