【科研经验贴】全要素生产率估计：从原理到Stata实操，我踩过的坑都在这了

我是章汕呐

993人浏览 · 2026-03-19 13:57:39

我是章汕呐 · 2026-03-19 13:57:39 发布

一、什么是全要素生产率？为啥要估计它？

很多刚接触实证研究的同学可能会问：“全要素生产率到底是个啥？我为啥要估计它？”其实全要素生产率（Total Factor Productivity, TFP）就是“除了劳动力、资本等投入要素之外，能促进产出增长的那些因素”——比如技术进步、管理效率、制度创新等等。简单来说，就是“同样的投入，为什么有的企业能产出更多，有的却不能？”那个“额外的”产出增长，就是全要素生产率带来的。

估计全要素生产率的意义特别大：

经济增长研究：可以分析经济增长的源泉——是靠投入要素的增加，还是靠全要素生产率的提高；
企业绩效研究：可以分析企业的核心竞争力——那些全要素生产率高的企业，往往有更好的技术、更优的管理；
政策评估：可以分析政策的效果——比如某产业政策是否提高了企业的全要素生产率；
比较研究：可以比较不同地区、不同行业、不同企业之间的全要素生产率差异。

二、常见的全要素生产率估计方法有哪些？怎么选？

常见的全要素生产率估计方法有以下几种，每种方法都有自己的优缺点和适用场景：

方法	优点	缺点	适用场景
OLS法	简单易懂，操作方便	存在内生性问题，估计结果有偏差	初步分析，或者当内生性问题不严重时
FE法（固定效应法）	可以控制个体固定效应，解决部分内生性问题	仍然存在 simultaneity 和 selection 偏差	当个体异质性较大，且内生性问题不严重时
OP法（Olley-Pakes法）	可以解决 simultaneity 和 selection 偏差	对数据要求较高，需要有投资数据	当数据质量较好，且有投资数据时
LP法（Levinsohn-Petrin法）	可以解决 simultaneity 和 selection 偏差，对数据要求较低	存在样本选择问题，需要有中间投入数据	当数据质量一般，且没有投资数据但有中间投入数据时
GMM法（广义矩估计法）	可以解决内生性问题，估计结果更可靠	对工具变量的要求较高，操作复杂	当内生性问题严重，且有合适的工具变量时

我一般会先用OLS法做初步分析，然后用OP法或LP法解决内生性问题，最后用GMM法做稳健性检验。当然，具体用哪种方法，还要看你的数据质量和研究问题。

三、Stata实操：手把手教你估计全要素生产率

我用Stata自带的企业数据（prodmp.dta）来演示，你可以换成自己的数据。

1. 数据准备

首先，我们需要导入数据，看看变量都有啥。 Stata代码：

use prodmp.dta, clear  // 导入数据
desc  // 描述数据基本信息

这个数据里，id是企业id，year是年份，lny是产出的对数，lnl是劳动力投入的对数，lnk是资本投入的对数，lnm是中间投入的对数，age是企业年龄，export是出口虚拟变量（1表示出口，0表示不出口）。

2. OLS法估计全要素生产率

这是最基础的方法，直接用OLS回归估计生产函数，然后计算全要素生产率。 Stata代码：

reg lny lnl lnk, r  // OLS回归，估计生产函数
predict tfp_ols, resid  // 计算全要素生产率（残差）

结果解读：lnl的系数是劳动力的产出弹性，lnk的系数是资本的产出弹性，tfp_ols就是全要素生产率（残差）。

3. FE法估计全要素生产率

FE法可以控制个体固定效应，解决部分内生性问题。 Stata代码：

xtset id year  // 设置面板数据
xtreg lny lnl lnk, fe r  // 固定效应回归，估计生产函数
predict tfp_fe, u  // 计算全要素生产率（个体固定效应+残差）

结果解读：lnl的系数是劳动力的产出弹性，lnk的系数是资本的产出弹性，tfp_fe就是全要素生产率（个体固定效应+残差）。

4. OP法估计全要素生产率

OP法可以解决 simultaneity 和 selection 偏差，但需要有投资数据。 Stata代码：

ssc install opreg  // 安装opreg命令
opreg lny lnk, exit(lnl) state(lnk) proxy(lnm)  // OP法估计生产函数
predict tfp_op, tfp  // 计算全要素生产率

参数说明：
- lny：产出的对数；
- lnk：资本投入的对数（状态变量）；
- exit(lnl)：劳动力投入的对数（退出变量）；
- state(lnk)：资本投入的对数（状态变量）；
- proxy(lnm)：中间投入的对数（代理变量）。

5. LP法估计全要素生产率

LP法可以解决 simultaneity 和 selection 偏差，对数据要求较低，需要有中间投入数据。 Stata代码：

ssc install levpet  // 安装levpet命令
levpet lny lnl lnk, proxy(lnm)  // LP法估计生产函数
predict tfp_lp, tfp  // 计算全要素生产率

参数说明：
- lny：产出的对数；
- lnl：劳动力投入的对数；
- lnk：资本投入的对数；
- proxy(lnm)：中间投入的对数（代理变量）。

6. GMM法估计全要素生产率

GMM法可以解决内生性问题，估计结果更可靠，但对工具变量的要求较高。 Stata代码：

xtabond2 lny lnl lnk, gmm(lny lnl lnk) iv(age export)  // 系统GMM回归，估计生产函数
predict tfp_gmm, resid  // 计算全要素生产率（残差）

参数说明：
- lny：产出的对数；
- lnl：劳动力投入的对数；
- lnk：资本投入的对数；
- gmm(lny lnl lnk)：用滞后变量作为工具变量；
- iv(age export)：用外生变量作为工具变量。

四、怎么解读全要素生产率的结果？

估计出全要素生产率后，我们可以做以下分析：

描述性统计：计算全要素生产率的均值、中位数、标准差等，看看全要素生产率的分布情况；
趋势分析：绘制全要素生产率的时间趋势图，看看全要素生产率的变化趋势；
比较分析：比较不同地区、不同行业、不同企业之间的全要素生产率差异；
影响因素分析：用回归分析，看看哪些因素影响了全要素生产率——比如技术进步、管理效率、制度创新等等。

Stata代码：

sum tfp_ols tfp_fe tfp_op tfp_lp tfp_gmm  // 描述性统计
by year, sort: sum tfp_op  // 按年份计算全要素生产率的均值
twoway (line tfp_op year), title("全要素生产率的时间趋势图")  // 绘制时间趋势图
reg tfp_op age export, r  // 影响因素分析

五、论文应用技巧：让审稿人眼前一亮

多方法对比：论文里可以同时报告OLS法、FE法、OP法、LP法、GMM法的结果，比较不同方法的差异，突出最优方法的优势；
稳健性检验：可以换不同的生产函数形式（比如Cobb-Douglas生产函数、超越对数生产函数）、换不同的变量定义（比如用名义产出还是实际产出）、换不同的估计方法，验证结果的稳健性；
可视化：可以绘制全要素生产率的时间趋势图、地区分布图、行业分布图，让结果更直观；
解释要接地气：别光说“全要素生产率提高了”，要解释成“企业的技术进步、管理效率提高了，使得同样的投入能产出更多的产品”。

六、避坑指南：这些坑我都踩过，你别再踩了

数据质量要高：全要素生产率的估计结果对数据质量特别敏感，一定要确保数据的准确性和完整性；
生产函数形式要合理：一般用Cobb-Douglas生产函数，如果数据允许，也可以用超越对数生产函数；
内生性问题要重视：OLS法和FE法都存在内生性问题，一定要用OP法、LP法、GMM法等解决内生性问题；
工具变量要合适：GMM法的结果对工具变量特别敏感，一定要选择合适的工具变量——比如滞后变量、外生冲击等。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

扩散模型快速采样：从渐进蒸馏到并行推理

对于同一概率流ODE轨迹上的任意点。

AtomGit开源社区

【大模型 API 中转站】上游接口不稳定怎么办？从优先级、权重到自动重试的多渠道容灾实战

在当前实现中，`retry_times = 2` 表示最多增加两次重试，加上首次调用，单个客户端请求最多可能尝试三次。当前实现还将 `504`、`524` 和“响应体无法正确解析”列为固定跳过重试的情况，不会被普通状态码配置重新打开。某些上游会用 `401`、`403` 或其他 `4xx` 表示渠道 Key、权限或余额异常。正常请求只会在优先级 `100` 的 A、B 之间选择。只有当前请求失败并

AtomGit开源社区

【人工智能】彻底搞懂AI技术：AI、AGI、LLM、Agent

LLM的全称是Large Language Model大语言模型。是一种基于海量文本训练的深度学习模型，核心能力是理解和生成自然语言。就像Web开发里的React、Spring Boot一样，LLM是AI领域当前最主流的技术路径，但不是AI的全部。LLM是AI的语言处理引擎。它非常擅长说话、理解语言、推理逻辑，但它只会说话。常见的 LLM 产品：• Claude （Anthropic 公司）• C