供应链|MnSc实证论文解读:如何削减长尾库存?在线零售中库存的价值

本次解读的文章发表于Management Science, 原文信息Baldauf, Christoph, Fredrik Eng-Larsson, and Olov Isaksson. “Where to cut the long tail? The value of carrying inventory in online retail.” Management Science (2024).
在线零售的一项重要优势在于,企业能够以较低成本在线展示大量商品。然而,线上可展示的商品范围并不等于都适合实际备货,零售商仍需在“库存商品”和“接单后采购商品”之间作出选择。本文基于一家欧洲家具与家居零售商18个月的日度销售与库存数据,考察商品备货是否会影响其线上销量。作者利用商品在零售商中央仓中随机进出库存的准自然实验,识别备货对销售的因果效应。研究发现,商品处于库存状态时,其销量平均提高约65%,且这一效应在不同商品之间存在显著差异:价格越高的商品,对是否备货越不敏感。基于此,文章进一步讨论了哪些类型的商品更值得被指定为库存商品,并指出线上零售商在决定“长尾”商品保留到何处时,不能仅依据历史销量或收入规模,还应综合考虑备货带来的需求提升及相应的仓储与处理成本。
1 研究问题
这篇文章讨论的核心,并不是一般意义上的选品问题,而是在线零售中“长尾” (long tail) 到底应当在哪里截断。网站可以展示很多 SKU,但仓储、搬运和处理成本有限,不可能所有商品都做仓储备货。对零售商而言,真正需要决策的是:哪些库存单位应被设为库存商品,放在中央仓中以较高服务水平履约;哪些应被设为非库存商品,在顾客下单后再向供应商采购。作者指出,从运营管理角度看,长尾并不是无限延伸的,企业终究要在某个位置“cut the tail”.
进一步看,文章真正要回答的研究问题是:将某个 SKU 实际放入库存,究竟会在多大程度上影响它的在线销量;以及,企业应如何把这种影响与仓储、搬运等相关成本结合起来,用于决定哪些 SKU 应当被归入库存商品、哪些应保留为非库存商品。作者并不把这个问题理解为传统的品类规划 (assortment planning) 问题,而是更聚焦于库存分类 (inventory classification) 本身的后果,即“被归为 库存商品 或 非库存商品”这一决策,会如何反过来改变销售表现。
这也正是本文与传统 ABC 分类思路的根本区别。现实中,企业往往依据历史销量或销售额来决定哪些商品应被重点备货,但作者指出,这样做存在明显局限:库存商品通常拥有更短、更稳定、也更明确的交付提前期 (delivery lead time), 因此本来就更容易卖得好;而非库存商品因为需要等待供应商发货,销量往往被压低。于是,历史销量并不是一个外生的输入,而是已经受到既有库存决策影响的结果。换言之,管理者真正缺少的并不是“过去卖了多少”的信息,而是一个反事实 (counterfactual): 如果一个原本没有备货的商品被放入库存,它本来会多卖多少? 这正是本文试图识别的核心问题。
2 场景、识别策略与模型设定
2.1 场景
这篇文章的经验研究场景来自一家欧洲高端家具与家居零售商。该零售商同时经营线下门店和线上商店, 其中线上渠道约占总销售额的 30%。样本期覆盖 2016 年 6 月 1 日至 2017 年 12 月 10 日,研究对象为线上商店全部 SKU 的日度销售与库存数据。在线上商店中,企业大约提供 10,000 个 SKU,产品从低价灯泡到高价设计师椅子、沙发不等。
在该公司的运营体系中,每个 SKU 都被预先指定为库存商品或非库存商品。库存商品存放于中央仓, 非库存商品则不在中央仓备货,而是在顾客下单后向供应商采购。由于企业只有一个中央仓,该仓库同时为线上顾客和线下门店供货,因此“是否在中央仓有货”就成为本文识别服务水平差异的核心变量。对于在线顾客而言,
- 如果某个 SKU 在中央仓有货,网页会显示绿色勾选和“ready for delivery”,顾客下单后通常可在 2–3 个工作日内发货;
- 如果某个 SKU 不在中央仓,则网页显示“ordering item”,零售商需要向供应商订货,再经中央仓转运,预计交付时间约为 2–8 周,而且这一等待时间并不精确,只能点击“estimated lead time”后进一步咨询客服。
换言之,这一设定将库存状态直接映射为顾客可观察的履约承诺 (delivery lead time / service level) 差异。文章还特别说明,该情境下商品退货率不到 1%,因此后续分析忽略退货影响。
2.2 识别策略
文章的识别难点在于,不能直接比较库存商品和非库存商品的平均销量。原因是库存指定决策本身具有内生性(endogeneity):企业原本就更可能把预期销量高、重要性高的 SKU 设为库存商品,以缩短交付周期并提高服务水平。类似地,也不能简单利用“从库存商品改成非库存商品”或反向调整的样本,因为这种人为调整通常也是基于需求预期做出的,例如春季将花园家具转入库存,或将过时地毯移出库存;这些转换本身仍然嵌入了对需求季节性的预判,因此不适合作为外生冲击。
为解决这一问题,作者利用了商品随机进出库存 (random transitions in and out of inventory) 所形成的准自然实验 (quasi-natural experiment). 其核心思路有两条。
第一,对于原本被指定为库存商品的 SKU,当中央仓因随机需求高峰而暂时断货时,网站显示会从“ready for delivery”变为“ordering item”. 对顾客来说,这种断货后的库存商品在可见层面上就与非库存商品几乎无异。由于零售商在库存规划时无法精确预知每日需求,这种临时断货可以被视为商品从“仓内有货 (in stock)”随机转到“上游供货 (upstream)”状态。
第二,对于原本的非库存商品,由于供应商普遍设置最小起订量 (minimum order quantities, MOQs), 但零售商对顾客不设置 MOQ,因此当顾客只下单 1 件时,零售商可能被迫向供应商采购 2 件、6 件或更多,除去发给顾客的数量,剩余商品会暂时留在中央仓中出售。这样一来,虽然商品名义上仍是非库存商品,但在一段时间内网站状态会从“ordering item”转为“ready for delivery”. 由于这种入仓并非企业事先根据需求预测主动安排,而是由单次订单和供应商 MOQ 共同触发,因此作者也把它视为一种从“upstream”随机转到“in stock”的外生变化。文章特别强调,这意味着样本中同时存在双向随机转换,而且这种转换既出现在 stock items,也出现在 nonstock items。
2.3 模型设定
在此基础上,作者建立了一个计量模型来估计库存位置对销量的影响。由于因变量是某一 SKU 在某一天售出的件数,属于非负整数,因此他们采用 Poisson 模型,并使用产品层面的聚类稳健标准误 (product-level cluster robust standard errors) 来处理过度离散问题。基准模型写为:

其中, UNIT_SALESit\mathit{UNIT\_SALES}_{it}UNIT_SALESit表示产品 iii在第 ttt天售出的件数; λit\lambda_{it}λit是 Poisson 参数,也就是该 SKU-day 的期望销量。核心解释变量 INSTOCKit\mathit{INSTOCK}_{it}INSTOCKit 表示商品在第ttt天是否位于中央仓:若商品在中央仓有货,则取值为 1;若商品位于上游,顾客下单后需要向供应商采购,则取值为 0.
需要注意的是,这里区分的是库存位置,而非长期类别标签。也就是说,哪怕一个商品原本被定义为库存商品,只要当天中央仓断货,它在估计中仍会表现为 INSTOCKit=0\mathit{INSTOCK}_{it}=0INSTOCKit=0. 反之,原本的非库存商品若因 MOQ 剩余库存暂时进入中央仓,也会在相应日期取值 1.
模型中的PRICEi\mathit{PRICE}_iPRICEi 是产品 iii在整个样本期内的平均销售价格,而不是每日价格。作者给出两个引入价格的原因。第一,价格对需求本身具有直接影响。第二,在库存分类文献中,SKU 经常按收入 (revenue) 进入不同服务水平类别,因此价格也会间接影响企业将商品设为库存商品或非库存商品的决策。换言之,价格既是需求决定因素,也是库存分类的重要背景变量。
另一个关键控制变量是PAGEVIEWSit\mathit{PAGEVIEWS}_{it}PAGEVIEWSit, 表示产品 iii在第 ttt天的独立页面访问量。作者并未使用所有页面点击,而是将同一用户在同一会话中的多次浏览合并,以更准确衡量网站流量。这个变量的作用,是为潜在需求冲击提供代理。因为如果某一天某个产品突然被更多消费者关注,它更可能同时出现销量上升和库存消耗,进而导致断货。若不控制流量,便可能把“需求冲击导致断货”误认为“断货导致销量变化”。因此,PAGEVIEWS\mathit{PAGEVIEWS}PAGEVIEWS是作者缓解可用库存内生性的重要控制项。
此外,ZitZ_{it}Zit是一组时间、产品和时间—产品层面的控制变量,包括星期几、季度/季节、产品固定效应、全店促销活动(campaigns) 以及个性化折扣码带来的推断式促销 (inferred promotions). 其中,文章将“当天价格低于该产品平均价格的 95%”定义为处于促销状态。产品固定效应通过组内去均值(demeaning)处理,目的是吸收那些不随时间变化的 SKU 固有特征,例如品牌、风格、设计属性等,使识别更多来自同一产品在不同日期的库存状态变化。
为了进一步分析价格是否会调节库存效应,作者在基准模型基础上加入了交互项INSTOCKit×PRICEi\mathit{INSTOCK}_{it}\times \mathit{PRICE}_iINSTOCKit×PRICEi,扩展模型可写为:
E[UNIT_SALESit]=λit=exp (β0+β1INSTOCKit+β2PRICEi+β3(INSTOCKit×PRICEi)+β4PAGEVIEWSit+uZit).E[\mathit{UNIT\_SALES}_{it}] = \lambda_{it} = \exp\!\left( \beta_0 + \beta_1 \mathit{INSTOCK}_{it} + \beta_2 \mathit{PRICE}_i + \beta_3 (\mathit{INSTOCK}_{it}\times \mathit{PRICE}_i) + \beta_4 \mathit{PAGEVIEWS}_{it} + u Z_{it} \right).E[UNIT_SALESit]=λit=exp(β0+β1INSTOCKit+β2PRICEi+β3(INSTOCKit×PRICEi)+β4PAGEVIEWSit+uZit).
这里β3\beta_3β3捕捉价格对库存效应的调节作用 (moderating effect). 作者在理论上提出两种相反的可能:
- 一是“服务溢价效应” (service premium effect), 即高价商品顾客可能更在意服务质量和快速交付,因此库存效应会更强;
- 二是“计划性购买效应” (planned purchase effect), 即高价家具往往属于提前规划的购买,顾客更愿意等待,因此库存效应会更弱。引入该交互项,就是为了在经验上识别究竟是哪种机制占主导。后文结果表明,交互项显著为负,支持后者。
从文章的估计框架来看,这一模型有两个优点。第一,它在产品固定效应控制下,主要利用同一 SKU 在“有货”和“无货”状态之间的日度波动来估计销量差异,因此比简单的横截面比较更接近因果解释。第二,Poisson 形式使系数可以被解释为对期望销量的比例性变化,这也是为什么作者后面能够把INSTOCK\mathit{INSTOCK}INSTOCK的系数转化为“有库存时销量提高约 65% 或 70%”这样的表达。也就是说,文章并不是把库存效应理解为固定增加若干件销量,而是理解为对期望销量水平的相对提升。

3 主要发现及分析
3.1 基准结果: 备货显著提升销量

见原文Table 5 (1). 作者首先用基准 Poisson 模型估计商品是否在仓 (INSTOCK) 对销量的影响。结果显示,INSTOCK 的系数为 0.528,且在 1% 水平上显著,对应的经济含义是:当商品位于中央仓、可被网站显示为 “ready for delivery” 时,其预期销量平均提高约 70%。作者进一步分别在库存商品和非库存商品子样本中估计,发现该效应分别约为 60% 和 75%。这说明,“是否备货”并不是纯粹的履约安排,而会实质性改变线上需求。
3.2 价格异质性: 越贵的商品,对备货越不敏感

在加入交互项INSTOCKit×PRICEi\mathit{INSTOCK}_{it}\times \mathit{PRICE}_iINSTOCKit×PRICEi后,作者发现该交互项在不同设定下都显著为负。例如,在原文表格 5 (2)-(4)和 模型 2 中,INSTOCK\mathit{INSTOCK}INSTOCK的系数为 0.627,而INSTOCKit×PRICEi\mathit{INSTOCK}_{it}\times \mathit{PRICE}_iINSTOCKit×PRICEi的系数为 -0.000504,二者都显著。这意味着:备货对销量的促进作用会随着价格上升而减弱。按 Figure 2 的可视化结果,售价约 100 欧元的商品,备货会使销量提高约 78%;而售价约 1,000 欧元的商品,提升只有约 13%。作者最终选用模型2,因为其拟合指标 MAD 和 CAIC 最优;在该模型下,平均价格商品的销量提升约 65%。
3.3 “少掉的需求去了哪里”: 没有明显延迟购买,也没有明显替代
第一,关于延迟购买 (delayed purchases), 作者用匹配方法比较断货商品与未断货但相似商品的销售轨迹。匹配质量见原文表格6,正式结果见原文表格7. 在 out-of-stock period,处理组相对控制组的销量差异为 -0.0336,且显著;而在 back-in-stock period,差异为 -0.0069,不显著。也就是说,商品补回库存后并没有出现明显反弹,没有证据支持“顾客只是等一等再买”。


第二,关于店内替代 (within-store substitution), 作者先做替代品配对分析,再做基于 lasso 的多对一替代检验。结果表明,在识别出的 1,000 个潜在替代关系中,商品自身在仓时销量仍显著提高 53%,但“替代品是否缺货”并不会显著提高该商品销量,z-statistic 仅为 1.7. 进一步看 原文表格 8,无论是用替代品缺货数量指标 USUP,还是加权指标 WUSUP,其交互项 INSTOCK × USUP 和 INSTOCK × WUSUP 都不显著,说明站内替代不足以解释主结果。

第三,关于渠道替代 (channel substitution), 作者检验了线上缺货是否把需求转移到线下门店。结果显示,当商品在线上从 in stock 变为 upstream 时,最大线下门店的销量并没有显著变化,z-statistic 为 -0.84. 因此,作者认为销量下降更接近于真实流失的需求,而不是转移到线下。


这一部分对应原文表格 9-10. 作者认为,价格本身未必直接导致顾客更愿意等待,PRICE 更可能是其他产品属性的代理变量 (proxy), 例如品类、计划性购买程度、产品类型等。为此,作者在表格9 中按品类对价格做标准化和归一化处理,结果价格交互项仍显著为负,说明主结论稳健。进一步在 表格 10 中对五个最大品类分别估计,发现“备货提升销量”的主效应在各品类中都成立,但价格调节效应只在 lighting 类别中显著。作者据此认为,价格能解释部分异质性,但它本质上是顾客等待意愿的一个可观测代理变量。
3.4 稳健性检验

第一,作者用工具变量法处理价格和库存状态可能存在的内生性。在考虑时变价格后,备货带来的销量提升仍约为 69%,与主结果非常接近。第二,作者用分层抽样检验样本选择偏差。重新构造更接近总体分布的样本后,备货效应约为 67%,与基准模型的 65% 没有显著差异。第三,作者加入 category × season 控制检验季节性与产品趋势。加入前后 INSTOCK 系数没有显著差异,说明主结果并非由品类季节性需求波动驱动。第四,作者把转化率而非销量作为因变量重新估计,结果见正文5.5.4, 商品在仓时转化率对应的销售提升约为 87%,方向和量级都与主结果一致。
4 管理启示
这篇文章的管理启示主要有三点。
第一,不能只按历史销量或销售额做库存分类。文章表明,商品是否备货本身会显著影响销量,因此过去卖得好,不一定只是因为产品“本来就好卖”,也可能是因为它一直处于库存状态、交付更快。换句话说,管理者在设定不同 SKU 的服务水平时,不能把需求当作外生给定。
第二,“长尾”该在哪里截断,要同时看需求、价格和成本。这一点对应文中的 Figure 4 如下。作者用一个简化库存模型说明,某个 SKU 是否应被设为库存商品,取决于备货带来的预期收入提升,能否覆盖处理与仓储成本。如果最优订货上限 (order-up-to level, OUL) 大于 0,就值得备货;如果等于 0,就更适合设为非库存商品。

第三,高收入 SKU 不一定就应该备货。文章的核心异质性结果是,高价商品的销量对“是否在仓”没有那么敏感,因此即使某些商品销售额高、利润率高,也未必值得占用仓储资源;相反,一些低价但销量频繁、顾客对等待更敏感的商品,反而更适合备货。也就是说,企业在决定在哪里截断长尾时,看的是“备货带来的增量收益”,而不是单纯看 收入 排名。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)