中国内陆水域碳(浓度、储量与通量)数据集

图片

数据集摘要

详情:https://mp.weixin.qq.com/s/LbRaFUt060lIJh1y0p-qvQ

1. 数据内容概述

该数据集是首个系统记录过去六十余年中国内陆水体溶解碳的多源、长时序综合数据集。核心内容包括两大部分:

  • 溶解碳浓度数据:涵盖溶解有机碳溶解无机碳的浓度信息。

  • 碳储量与通量数据:提供流域尺度的碳储存量(湖泊、水库)和输送通量(河流)估算。

时间范围

  • 浓度数据:1960年至2022年

  • 储量与通量数据:1990年代至2010年代(分年代统计)。

空间范围

  • 覆盖中国全境,具体包括九大流域:松花江-辽河、海河、黄河、淮河、长江、东南诸河、珠江、西南诸河、西北诸河。

  • 涉及2,211个湖泊、506个水库和16,595条河流

数据类型与记录量

  • DOC浓度记录18,238条

  • DIC浓度记录18,853条

2. 数据来源与获取方法

数据集通过整合四大类数据源构建,确保了其全面性和代表性:

图片

关键衍生数据计算方法

  • 河流DOC浓度:基于262对同步观测数据,建立 DOC = 1.03987 × CODMn - 0.0463 (R²=0.73)的线性回归模型,从历史高锰酸盐指数数据重建。

  • DIC浓度:使用CO2SYS软件,输入pH、水温和碳酸盐碱度计算。碱度由随机森林模型估算总碱度后,扣减基于DOC估算的有机碱度贡献得到。

  • 湖泊水量:基于遥感获得的湖泊面积,使用经验公式 V = 1.2601 × A^1.1726估算。

  • 碳储量(S)与通量(F)

    • 湖泊/水库储量:S = C × V(C为平均浓度,V为水量)

    • 河流通量:F = C × R(C为平均浓度,R为径流量)

3. 数据结构与格式

包含三个主文件夹:

浓度数据文件夹

    • 文件格式:Microsoft Excel (.xlsx)。

    • 内容:三个文件分别对应CNEMC数据、野外实测数据和文献收集数据。

    • 属性字段:编号、水体中英文名称、所属流域、地理坐标、DOC/DIC浓度(mg/L)、时间(年份/月份)、分析方法、仪器、参考文献、质量标识。

图片

储量与通量数据文件夹

    • 流域ID、中英文名称。

    • 水文数据:河流径流量(km³/yr)、湖泊/水库容积(km³)。

    • 碳数据:平均DIC/DOC浓度(mg/L)、河流DIC/DOC通量(10⁹ g C/yr)、湖泊/水库DIC/DOC储量(10⁹ g C)。

    • 文件格式:Shapefile (.shp) 和 Excel (.xlsx)。

    • 内容:包含中国九大流域的矢量边界数据和统计表格。

    • 属性字段

      • 流域ID、中英文名称。

      • 水文数据:河流径流量(km³/yr)、湖泊/水库容积(km³)。

      • 碳数据:平均DIC/DOC浓度(mg/L)、河流DIC/DOC通量(10⁹ g C/yr)、湖泊/水库DIC/DOC储量(10⁹ g C)。

图片

补充数据文件夹

    • 文件格式:Excel (.xlsx)。

    • 内容:用于建立DOC-CODMn回归模型的262对原始同步观测数据及其参考文献列表。

图片

4. 数据质量与验证

研究对数据生成的关键模型进行了严格验证:

图片

5. 数据局限性与不确定性

文献明确指出了数据集的主要不确定性来源,这对数据使用至关重要:

  1. 浓度估算的不确定性

    • DOC:全国尺度河流DOC估算不确定性约为±27.85%。不同文献来源的DOC因分析方法差异可能存在3-6% 的低估(湿化学氧化法 vs. 高温燃烧法),数据集保留了原始值,因此DOC储量/通量可视为保守估计

    • DIC:主要不确定性来自碳酸盐碱度估算,导致DIC浓度的总体不确定性范围约为 -24.17% 至 +31.86%

  2. 水量估算的不确定性

    • 湖泊水量基于面积-经验公式估算,对深水构造湖可能存在系统性低估。数据集主要反映空间格局和相对变化。

  3. 时空代表性的假设

    • 在计算流域储量/通量时,采用了观测期内的平均浓度,忽略了浓度的年际和季节变化。敏感性分析表明,这可能导致对1990年代的通量/储量有最高约22%的高估,但对2000年代以后的影响很小。

  4. 垂直均一性假设

    • 假设水体垂直方向碳浓度均一,可能忽略深水湖泊的分层效应。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐