新手小白学习数据分析04----OSM + AARRR,一场酣畅淋漓的归因定位
0 前言
突然发现,之前所学习的内容的核心都在于如何将数据可视化,这一点是重要的,不过分析数据的进程可以往前进一进,往分析走一走,一直听说AARRRR模型,A/B测试啥的,这一篇博客就是围绕业务分析思维的,宝贝们,可以用于面试滴~希望对你有帮助!
这篇博客主要是通过一个案例,学习 OSM 框架 + AARRR 模型进行异动分析并归因定位,找到异动原因。
预告一下,下一篇博客会详细介绍在搭建指标体系、找到原因后,如何进行实验确认原因是正确的,并提出相应的解决措施。
接下来博客会进行详细的介绍。
1 作用
首先,我们需要明确一下数据分析师的职责。
数据分析师的核心:
- 用数据讲故事
- 用逻辑做决策
- 帮业务找到“为什么”和“怎么办”
我真心觉得数据分析师好牛,把一堆看似毫无价值的数字,进行清晰、筛选、可视化,就能从中挖取价值,一种变废为宝的感觉。
2 案例
通过具体的一个案例来学习相关业务——"快购"业务。这项业务出现了一些问题:用户注册量增长停滞并且新用户次日留存率突然下降10%,于是提出了我们的业务目标:提升新用户规模和质量。
新用户规模可以理解为用户越多越好,质量很好理解,就是希望用户留存率高,留存下来的用户。
- 问题:
· 注册量增长停滞;
· 新用户次日留存率突然下降10%。- 业务目标:
提升新用户规模和质量(增长&留存)
新用户次日留存率=次日仍活跃的首日新增用户数 ÷ 首日新增用户数×100%
举个例子:
4月21日,新增了 100 个新用户
4月22日,有 15 个人又打开/使用了产品
那么,新用户次日留存率 = 15÷100×100% = 15%
在使用任何数据之前,都需要保证数据是正确的,即数据验证,另一方面,每一项概念的定义需要保持一致,不能业务部是这个意思、运营部是那个意思,拥有标准的统一规范。
因此,需要统一统计口径,标准化概念。
关键点说明:
- 统计口径必须统一
· 只算当天首次注册/首次启动的用户
· 老用户回流不算新用户- “次日”怎么算
一般指:
·首日:T 日
次日:T+1 日(自然日/24消失,看产品规则)- “活跃”怎么定义
不同产品不一样,常见:
·打开APP/进入小程序
·完成登录
· 完成某个关键行为(下单、发帖、看视频等)
3 指标体系
指标体系搭建是数据分析师工作过程中比较常见的场景,也是面试的“必考题”!
指标体系的作用:
- 衡量健康度:用关键指标来判断现在的运行环境是否健康,使得健康程度得以量化。
- 定位问题:指标异常变化能够让我们定位问题出在哪个环节。
- 评估效果
- 统一语言:A 从 B 角度说可以,B 从 C 角度说不行,因此需要统一的语言来定性。
核心思想,找到与目标最紧密相关的几项指标,找到数据的异常变动,顺着数据发掘出现变动的原因,进行异动分析,归因定位,接着根据原因,提出相应的解决措施。
4 如何搭建指标体系?
前文,了解到指标体系是基石,是非常关键的分析环节的参考数据,那么,如何搭建合理高效的指标体系,需要用到 OSM 框架 + AARRR 模型搭建指标体系。OSM 框架是指标体系的“骨架”,AARRR 模型是“血肉”,两者结合起来构成整体的指标体系。
4.1 OSM 框架
· OSM用来搭建框架
- Objective 目标:最终想达成的目标。
- Strategy 策略:为了达到目标,从哪些方面努力,这就需要拆解用户旅程了,AARRR 模型来解决这个问题。
- Measurement 度量:针对每个策略,用什么具体指标来衡量效果,进行量化分析。
连接"快购"案例分析:
O:提升新用户规模和质量;
S:使用 AARRR 模型分析;
M:具体指标。
4.2 AARRR 模型
此模型又称为海盗模型,对用户旅程进行拆解。她把用户从接触到成为忠实用户的过程,分成了 5 个关键阶段,使用此模型拆解"快购"新用户的旅程,并找到每个阶段的“度量指标”。
那是不是每个阶段我都一定要有度量指标呢?后文会有解答,往后面看哟?
这 5 个关键阶段分别是:获取、激活、留存、变现和推荐。
- Acquisition 获取:怎么让更多人知道"快购"并注册?
- Activation 激活:注册了,怎么让用户快速体验到"快购"的核心价值观?如何让用户使用“快购”?
- Retention 留存:怎么让用户第二天、第七天、第三十天还愿意回来?比如我购物经常用淘宝。
- Revenue 变现:怎么让用户开始花钱?
- Referral 推荐:怎么让新用户愿意分享"快购"给朋友?
OSM目标 -> AARRR策略拆解 -> 具体指标度量
通过此链条模式,搭建完整指标体系。
Acquisition 获取
策略:如何让更多人知道“快购”并注册?
具体措施:
- 投广告(抖音、B 站、应用商店的开屏广告)
- 做裂变活动(邀请有礼)
- 优化注册流程
通过什么数据来判断有更多用户注册“快购”了呢?这时候就需要度量指标了。
度量指标:
· 新用户注册数:核心!衡量规模
· 各渠道注册转化率:点击广告的人里,有多少成功注册了?衡量渠道效率
· 获客成本 CAC:拉一个新用户花了多少钱?衡量投入产出比。面试加分点!
连接“快购”:
注册量增长停滞?先看这几个度量指标,是哪个渠道不行了?还是注册流程太复杂导致转化率低?
CAC = 某段时间内的总获客花费 ÷ 同期通过这些花费带来的新客户数
Activation 激活
策略:注册后,怎么让用户快速体验到“快购”的核心价值?
具体措施:
- 新手引导
- 首单大额优惠券
- 个性化推荐
- 热门商品展示
度量指标:
- 新用户注册后首日核心行为完成率:超级重要!!!比如:
· 浏览商品 > 5 的用户占比?
· 加购用户占比?
· 完成首单用户占比!激活的黄金指标!!- 新用户首单转化时间:从注册到完成首单的平均时间,越短说明激活效果越好
连接“快购”:
次日留存率低?很可能激活没做好!用户注册了,但啥也不干,或者没有体验到价值,第二天自然不想来。
Retention 留存
策略:怎么让用户第二天、第七天、第三十天还愿意回来?
具体措施:
- 个性化推送
- 签到积分
- 会员体系
- 复购券
- 优化商品/内容
度量指标:
- 次日留存率:当前核心监控指标!(注册日D0,D1日活跃即算留存)
!当前重点监控指标- 7日/30日留存率:看长期粘性
- 留存用户活跃度
如:平均访问时长、访问次数,衡量用户参与度
连接“快购”:
当前最痛的点!
次日留存率降了10%?这就是咱们要重点拆解的“异动”!后面异动分析环节就靠它了。
异动:异常波动
Revenue 变现
策略:怎么让新用户开始花钱?
具体措施:
- 首单优惠
- 复购激励
- 交叉销售
- 提升客单价
度量指标:
- 新用户首单转化率:和激活有重叠,但更侧重付费
- 新用户首单客单价:衡量新用户首次消费金额
- 新用户首月复购率:衡量新用户重复购买意愿
- 新用户生命周期价值 LTV:一个新用户从注册到流失,预计能给“快购”带来多少总收入?
面试高分点!
LTV > CAC:赚钱
LTV ≈ CAC:不转不亏
LTV < CAC:拉一个亏一个
行业通用健康标准:
LTV : CAC ≥ 3 : 1
连接“快购”:
留存率低,LTV 肯定受影响,提升留存是提升LTV的基础。
##e# Referral 推荐
策略:怎么让新用户愿意分享“快购”给朋友?
具体措施:
- 邀请有礼(双方得利)
- 分享得积分/优惠券
度量指标:
- 新用户分享率:注册用户里,有多少人分享了链接/海报?
- 邀请注册转化率:被分享的人里,有多少成功注册了?
- K因子 K-Factor:平均每个老用户能带来多少新用户?
面试加分点!K>1说明能病毒式增长。
K因子 = 一个用户能带来多少个新用户,也叫病毒系数,用来衡量产品自传播、裂变能力有多强。
- 计算公式:
K = 邀请发送数 × 邀请转化率- K因子代表什么?
· K < 1:传播会慢慢衰减,最后停掉,靠花钱买量才能增长。
· K = 1:一个用户带来一个新用户,刚好自我维持。
· K > 1:裂变会指数级爆发,用户自己滚雪球增长,就是传说中的病毒式增长。
连接“快购”:
如果新用户体验好,推荐是最低成本获客的好途径。当前阶段可能不是重点,但体系里要有。
4.3 面试场景模拟
跟着 OSM+AARRR 框架,分三步走,逻辑清晰!
请为“快购”APP的新用户增长与留存搭建一套核心指标体系
- O:定目标——懂业务
- S:拆策略——使用AARRR用户旅程串起全链路
· 获取:各渠道注册转换率、新注册用户数
· 激活:首单完成率
· 留存:次日留存率(当前重点)
· 变现:首单转化率、首单客单价、LTV
· 推荐:新用户分享率、邀请注册转化率
- M:定指标——抓重点,别堆数据
· 最高优先级指标:次日留存率(当前紧急)
· 北极星指标:新用户 30 日留存率或首月LTV(长期)
· 北极星指标(North Star Metric)是业务的“命门指标”,是唯一一个能代表“业务成功了”的指标。
· 它不是短期指标,而是能反映长期价值的核心指标,能够指导团队方向,避免被短期波动干扰。
连接“快购”:
· 北极星指标:新用户 30 日留存率
因为新用户注册量可能刷量,次日留存率是短期指标,波动大。30 日留存高的用户,大概率会复购、会推荐,长期 LTV 才高!
4.4 Q&A
- Q1:AARRR 五个环节都要监控吗?会不会太多?
不用!当前阶段抓重点,比如“快购”现在重点是“留存”,那就紧盯 AARRR 里的“激活”和“留存”,其他环节可以先简化,等业务稳定了再补全。
- Q2:北极星指标和核心指标有啥区别?
北极星指标是“唯一最重要的战略指标”(比如30日留存),核心指标是“支撑当前目标的几个关键指标”(比如次日留存、首单转化率)。北极是指方向,核心指标打仗!
- Q3:如果业务目标不清晰,怎么搭指标体系?
找业务方聊:“老板,您觉得新用户业务,最重要的是什么?是拉新?还是留存?”,只有目标对齐了,指标体系才能搭对!
5 异动分析
什么是异动?
数据指标发生了超出预期的、显著的波动。
异动分析是数据分析师的日常工作之一,面试的高频考点。
异动分析典型场景:
“快购”新用户次日留存率昨天突然从 40% 暴跌至 30%。
5.1 数据验证优先
异动分析第一步,特别是面试第一步,永远、永远、永远不是拆维度找原因,而是验证数据本身是否正常!
- 数据是否正常产出?
- 数据管道通不通?
- 埋点代码挂没挂?
- 计算任务跑没跑?
- 日志全不全?
· 埋点代码,就是写在 APP/网页/小程序里的一小段代码,用来“偷偷记录用户做了什么”。
· 举个例子:比如做了一个按钮“立即领取”:
· 没埋点:只是知道有人点了,但不知道是谁点的、点了几次、从哪里来的
· 加了埋点代码:后天立刻收到一条日志
用户 ID=123,在首页,点击了立即领取按钮然后就能算出:按钮点击率 = 点击人数/页面访问人数
- 数据口径是否发生变更?
- 指标的定义有没有被偷偷改过?
- 指标的计算方法有没有变化?
- 指标的统计范围有没有调整?
- 口径一变,指标自然就变了!
5.2 异动分析完整流程
数据验证优先!只有确认了数据本身是靠谱的(正常产出+口径一致),才能开始真正的业务分析!
异动分析的完整流程如下图所示:
定义问题 -> 数据验证 -> 维度拆解 -> 原因假设 -> 实验数据验证 -> 根因定位
步骤一:定义问题
场景背景:
新用户次日留存率暴跌10%
步骤二:数据验证
- 第一优先级:数据产出检查
找数据团队同事:任务跑成功没?日志全不全
确保任务成功跑了,日志量级也正常,数据产出没问题!
- 第二优先级:口径确认
找产品经理:最近“次日留存率”或者“活跃用户”的定义改过没?统计范围有调整吗?
确保口径没问题!
结论:数据本身是可信的!这10%的下降是
真实的业务异动!咱们可以开始拆维度了!
步骤三:维度拆解
维度1:时间维度
查看这 10% 的下降发生的时间段。

维度2:用户维度
哪个渠道拉来的新用户留存崩了?抖音?应用商店?B站?(分渠道看留存率!)

问题主要出在昨天下午2点到晚上10点,通过抖音广告渠道注册的新用户身上!他们的留存率暴跌了13%,拉低了整体。
维度3:行为维度
这些抖音新用户,是首日行为有变化吗?比如完成首单的比例?浏览商品数?

抖音渠道新用户留存暴跌,直接原因是他们首单转化率大幅下降!很多人注册了,领了券,加购了,但最后没下单!
步骤四:原因假设
基于拆解结果(特定时间段 + 抖音渠道 + 首单转化率暴跌),提出具体假设:
-
- 广告/落地页问题(最可能!)
昨天下午 2 点开始,抖音渠道投放的广告素材或落地页发生了变化!比如:素材夸大宣传,落地页商品与实际不符,或者落地页加载慢、有 Bug,导致用户预期落差大,虽然领了券加购了,但最后支付环节放弃。
-
- 优惠券问题
昨天抖音渠道新用户使用的首单优惠券,在支付环节大面积失效或无法使用?(可能性较低,因为领券率还高了。)
-
- 商品/库存问题
落地页推荐的核心商品,在昨天下午时间段大面积缺货或价格异常上涨?(需要验证)
步骤五:数据验证
- 怎么验证假设1?立即找市场和运营团队!
· “抖音广告素材/落地页昨天下午2点后有没有更新?版本号是多少?”
· “检查昨天抖音渠新用户在支付环节的失败日志,看是不是集中在‘优惠券无效’、‘商品不存在’、‘价格不符’这些错误上”
· “分析抖音渠道新用户首单失败的具体原因分布。”
- 模拟验证结果(
根因找到!)
· 市场团队确认昨天下午2点上线了新的“9.9元包邮”爆款广告素材和落地页。但后台数据显示,该爆款商品库存不足,大量用户点击后显示“已售罄”或“补货中”,导致支付失败率飙升!
步骤六:根因定位
- 最终根因
· 市场团队确认昨天下午2点上线了新的抖音广告素材和落地页,主打“9.9元包邮爆款”,但该商品库存准备不足,导致大量抖音新用户在支付环节因商品缺货而失败,首单转化率暴跌,进而导致次日留存率大幅下降。
5.3 本章小结
完整分析流程:
数据验证优先 -> 维度下钻定位范围 -> 行为分析找到关键点 -> 业务假设验证根因
6 知识点补充
6.1 统计显著性
统计显著与否?下降10%是真的有问题,还是纯属运气不好(随机波动)?
面试话术:
对于 10% 这种大幅下降,在用户基数足够大的情况下(比如日活百万级),可以初步判断为显著异动,需立即排查,但如果波动很小(比如1%),我会用假设检验验证统计显著性,避免误判。
!!!大波动直接行动,小波动用统计方法验证!
6.2 对比分析
异动 = 对比 + 维度拆解
- 时间对比
· 环比:昨天 vs 前天
· 同比:上周三 vs 本周三
- 分组对比
· 渠道:抖音 vs 快手
· 版本:新页 vs 旧页
· 用户群:新用户 vs 老用户
6.3 辛普森悖论 & 常识判断
- 辛普森悖论
· 经典案例:平台整体留存率下降,但拆开看每个渠道留存率都上升?
· 原因:用户结构变化(比如低留存渠道用户占比激增)
· 拆维度时一定要看分组数据!否则可能被表面数据误导,比如以为整体变差,其实是流量结构出了问题。
避免辛普森悖论三句话:
- 不看总数,看分组
- 不看简单平均,看加权
- 不比混乱结构,比同批次、 同结构
- 常识判断
终极心法:流程是死的,人是活的!
如果抖音日活单日暴跌40%,第一反应不是拆维度,而是:数据肯定挂了!
面对极端异动,会优先验证数据链路(埋点、计算、存储),再谈业务分析——体现经验值!
- 抖音这种体量的产品,日活6亿+级别,正常波动 ±1%、±2%,大波动 ±5% 已经很夸张了,单日暴跌 40%,即直接少掉 2 亿多日活,现实中根本不可能发生,因此这种幅度的下跌,违背常识、违背业务逻辑,肯定是数据埋点、接口、统计服务、日志上报崩了!
- 什么是数据挂了?
· 埋点代码崩了,用户行为没上报上来
· 日志队列堵了,数据延迟/丢失
· 数仓任务失败,当天数据没算出来
· 服务器宕机、接口报错
· 统计口径被人误改了
· 测试数据混进线上
结果:不是用户少了,是你“数不到”用户了。
6.4 Q&A
- Q1:如果数据验证发现口径变了,但业务方不承认怎么办?
拿出
历史数据、指标定义文档、变更记录,用数据说话,必要时升级沟通。
- Q2:维度拆解,先拆哪个维度最好?
没有绝对顺序,通常按业务相关性和数据可得性。用户渠道、行为往往是最高优先级。时间维度看趋势也很重要。
6.5 本章小结
“诊断”部分的核心:
- 流程铁律:
数据验证优先!(产出正常+口径一致)再谈业务分析; - 分析利器:维度下钻!(时间、用户、行为)定位问题范围;
- 关键抓手:对比分析!(环比、同比、分组)找出差异;
- 心法提醒:统计显著性、辛普森悖论、常识判断!避免踩坑;
- 终极目标:定位根因!用数据讲清楚“为什么”。
7 后记
如果本篇博客对你有用的话,点个赞叭!
笑死我了,我去查阅为什么 AARRR 模型又称为海盗模型,原来是因为这个模型的发音类似电影中海盗的经典口头禅 “Arrr!”。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐





所有评论(0)