“政府风险感知”是基于文本分析方法构建的量化指标,旨在刻画地方政府对宏观经济与发展风险的主观认知程度。该指标以政府工作报告为信息载体,通过识别报告文本中与风险相关的表述,为研究政府行为、政策取向及其经济后果提供可量化的实证基础。

基于此数据集,可系统开展以下研究一是检验政府风险感知对企业创新、投资决策等微观行为的影响;二是分析政府风险认知通过政策调控、财政支出等渠道影响宏观经济运行的机制;三是探讨在不同地区发展水平、产业结构及制度环境下,政府风险感知的异质性表现及其经济后果。

本数据集参考田子方等(2025)发表于《宏观经济研究》的论文《风险感知与企业创新——来自政府工作报告的文本分析发现》,通过Python建立卷积神经网络,对中国地级市的份政府工作报告构建政府风险感知指标。具体步骤如下:①将报告文本进行分句、分词,同时建立Word2Vec模型,将分词转化为数字向量。②从分句数据集中随机抽取2000条分句作为样本数据集并进行人工标注。③将标注样本按照3:1:1的比例随机分为训练集、验证集和测试集,使用Python的keras库构建卷积神经网络模型对标注样本进行训练,同时不断调整模型超参数,选择在测试集上分类精确率(precision)最高的模型对总体数据集进行文本分类。④用“报告i中表征风险的句子数占报告i句子总数的比值”来衡量政府风险感知程度。

数据指标

[图片]

数据截图

[图片]

参考文献

[1] 田子方, 杨依婷, 付家秀. 风险感知与企业创新——来自政府工作报告的文本分析发现[J]. 宏观经济研究, 2025, (08): 107-124+127.

顶部专栏分享更多内容

来源:Paper数据分析

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐