基于 AlphaEarth Foundations 的年度泛热带商品作物地图数据集
扩大透明度:基于 AlphaEarth Foundations 的年度泛热带商品作物地图
来源:Google Earth 官方博客
作者:Alicia Sullivan(产品经理)& Katelyn Tarrio(Google Earth Engine 开发者关系)

要有效遏制全球森林砍伐,地理空间社区所需要的不仅仅是一张关于“树木”的时间快照,更需要一份一致、高分辨率的森林土地利用演变记录。今天,我们激动地宣布空间透明度领域的一个重大里程碑:我们发布了年度、全球范围的经济林木地图(咖啡、可可、油棕和橡胶),这些地图基于 Google Earth AI 技术栈中的 Google 卫星嵌入数据集(Satellite Embedding) 构建。
这一数据集代表了首个泛热带、开源、10米分辨率的可可、咖啡和橡胶地图——而这几个经济林木恰好与森林砍伐高度相关。这些地图是森林数据伙伴关系(Forest Data Partnership, FDaP) 的核心成果。FDaP 是一个全球性联盟,致力于通过协作改进监测和供应链追踪来遏制森林损失。通过将覆盖范围从单个国家扩展到整个热带地区,我们正在填补一个几十年来阻碍保护工作的关键数据空白。
这些地图的诞生得益于建模方法的改进。从传统的影像合成转向 AI 驱动的嵌入(embeddings),我们能够提供更精确、无缝隙、时间一致性更高的数据,帮助各类组织应对紧迫的可持续发展要求,实现全球保护目标。接下来,让我们详细介绍本次发布的关键改进。
有哪些新内容?
本次发布是我们迄今为止规模最大、最完整的地图集合,为地理空间社区提供了一个高质量基线,用以追踪森林土地利用变化的关键驱动因子。
- 泛热带范围:四种作物的覆盖范围已从选定的单个国家扩展到整个泛热带地区。
- 时间轴扩展:今天发布 2020 年和 2024 年的数据,目前正在反向填充 2017 年至 2025 年的所有年份。
- 空间噪声降低:基于嵌入的方法获得了“更干净”的地图,减少了像素级别的伪影和椒盐噪声——这些噪声此前使得田地边界的描绘变得困难。
- 时间稳定性提升:由于时间特征被直接编码到嵌入向量中,我们显著减少了因分类误差导致的年度间虚假变化检测,使得逐年比较更加可靠。
- 开放获取:为实现最大程度的可访问性和影响力,这些地图现在采用 CC BY 4.0 许可证,供所有用户使用,并可在 Earth Engine 的森林数据伙伴关系数据目录中获得。
- 灵活交付方式:除 Earth Engine 外,我们还将所有已发布的地图以 云优化 GeoTIFF(COG) 格式存放在一个 requester-pays 的 Google Cloud Storage(GCS)存储桶中,方便使用 QGIS、ArcGIS 或自定义云原生工作流的用户无缝集成。
从静态合成到动态模式:AlphaEarth 的优势
*
上图:巴西米纳斯吉拉斯州 Chapadão de Ferro 地区的一个咖啡农场。上半部分为卫星嵌入数据集视图,下半部分为 Sentinel-2 合成图 + 咖啡概率模型。
驱动这些新地图的核心引擎是 AlphaEarth Foundations 卫星嵌入数据集。通过用嵌入(embeddings)替代传统的影像合成,我们从根本上改进了模型“观察”地表的方式。
在过去,我们的地图使用 Sentinel-1、Sentinel-2 和 PALSAR-2 的年度合成影像。这种方法存在局限:热带关键区域的持续云层或传感器数据缺失会产生缝隙。同时,将一整年的数据压扁为一个简单的平均值,会丢失重要的季节性信号(如开花和收获模式),而这些信号恰恰是区分不同经济林木所必需的。
卫星嵌入技术通过将多源传感器数据融合为一个统一的、64维的地球表面表征,解决了上述挑战,并提供以下主要优势:
- 全覆盖无缝隙:借助模型跨传感器填补缺失信息的能力,我们现在能够提供整个泛热带地区的一致年度推理结果——即便在最多云的区域也是如此。
- 时空信息编码:嵌入向量编码了地表的时空特征,而非静态平均值。它们捕获了一整年的生长周期和季节性,这对于区分光谱相似作物(如咖啡和可可)至关重要。
- 跨传感器关系:嵌入空间不仅考虑两三个传感器,还整合了气候数据、数字高程模型(DEM)和多颗卫星传感器之间的复杂关系。这种特征丰富、多维度的视角使模型能够理解作物生长的生态背景,显著降低误检率。
通过移除构建自定义合成图的“预处理成本”,任何人都能以最少的设置将这些最先进的模型应用到卫星嵌入集合中。用于生成地图图层的训练模型现已在 GitHub 上发布。
上图:利比里亚与科特迪瓦边境森林保护区之间的可可和橡胶农场。
社区驱动的制图
这个项目的独特之处不仅在于 AI,还在于我们对持续、社区驱动的反馈循环的承诺。森林数据伙伴关系的包容性“社区”方法优先考虑协作,联合学术界、政府、非政府组织和行业中的利益相关方,汇集多样化的数据集来训练、测试和验证机器学习模型。这种协同效应提高了最终模型和地图的质量,提供了更全面的商品作物和森林砍伐情况视图。
自 2025 年 6 月上次发布以来,我们简化了数据导入流程,能够快速将区域输入数据转化为全球适用的模型。如今,随着我们的合作伙伴网络不断扩展,地图也随之演进。
自 2025 年 6 月上次发布以来,来自合作伙伴的大量实地数据成为催化剂,帮助我们扩大了地理覆盖范围并提高了模型精度。这一里程碑得益于以下机构慷慨的数据贡献:Olam Food Ingredients Coffee Platform、国际生物多样性联盟、CIAT 以及 Meridia。我们还要感谢更广泛的森林数据伙伴关系团队持续的反馈和验证。通过汇集这些多样化的数据集,我们构建了比任何一个单一组织都能独立实现的、更全面的全球商品作物范围视图。如果您希望提供反馈或为社区工作做出贡献,请通过[此链接]联系我们。
森林土地利用地图的新基线
通过更好地区分天然森林和经济林木,这些地图为多种全球保护目标提供了全新水平的精度。例如:
- 支持管辖级森林监测:对各国政府而言,识别种植园是一个颠覆性的进步。可以将橡胶、油棕等经济林地从森林基线中剥离,确保采伐或作物轮作不会误判为毁林,并且碳信用与真正的天然林保护挂钩。
- 法规合规性:随着欧盟毁林法规(EUDR)等法规的出台,企业需要一致、高分辨率的数据来证明其供应链无毁林行为。我们基于年度概率的地图提供了一种标准化的方法,可在整个热带地区监测这些合规要求。
- 整合天然森林数据:这项工作是对 Google DeepMind 和 Google Research 与世界资源研究所合作发布的“2020 年世界天然森林”地图的直接补充。通过联合使用这些数据集,地理空间社区终于能够以行业顶尖的精度区分原始森林、退化景观和人工管理的经济林木。
下一步计划
作为森林数据伙伴关系的创始成员,我们致力于在全球范围内绘制由商品驱动的森林砍伐地图。虽然 AI 和更多的训练数据推动了重大进展,但这仍然是一个迭代性的里程碑。全球小农系统的巨大差异性意味着一些误差(例如对次生林或农林复合区域的过度估计)仍然存在。我们现在共享这些地图,是因为我们相信,当社区共同进行压力测试和协作改进时,进步会更快。
展望未来,随着每年新的年度嵌入图层可用,我们将持续制作年度地图。我们希望通过开放的反馈循环来支持这种透明度,邀请科学界共享经过实地验证的数据,以帮助改进未来的版本。您可以通过[此链接]参与社区的反馈和努力。
通过这项工作,我们学到了大量关于使用 AlphaEarth Foundations 卫星嵌入来扩展全球分类系统的经验,并非常兴奋在接下来的几个月里与 GEE 社区分享更多技术深度文章。
如何开始使用
- Earth Engine 用户:您可以在 Earth Engine 数据目录 中找到新的 2025b 商品地图。
- GCS 数据:数据也可以作为 COG(云优化 GeoTIFF)在 requester-pays 存储桶中获得,路径为:
gs://earth-engine-public-requester-pays/forestdatapartnership(详见下文说明)。 - 训练模型:模型可在 森林数据伙伴关系 GitHub 仓库 中找到。
在 GCS 上访问 FDaP 数据
开始访问非常简单。数据集存储在一个名为gs://earth-engine-public-requester-pays/forestdatapartnership/2025b 的公共 GCS 存储桶中。要访问文件,您可以使用 gcloud storage 命令行工具,或者通过 GCS API 读取数据。该 API 被许多工具包支持,包括 GDAL(参见这篇博客)。有一份详细指南包含了众多重要的技术细节,以下为部分摘要。
存储桶中的文件采用标准地理空间格式 Cloud Optimized GeoTIFF(COG),该格式专为高效的互联网访问而设计。
许可证与署名
本数据根据 Creative Commons Attribution 4.0 (CC-BY 4.0) 许可证 免费提供使用。
如果您在作品中使用了本数据集,请包含以下署名信息:
“Produced by Google for the Forest Data Partnership”
关于费用的说明
GCS 存储桶设置为 “requester pays”(请求者付费)。简单来说,这意味着数据本身是免费的,但您需要承担下载文件所产生的任何费用(出站流量费用)。在许多情况下,直接在 Google Cloud Platform 上分析数据是免费的。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
![[点击查看完整图片]](https://i-blog.csdnimg.cn/direct/d3c72a6813b5461bb7c3b86aae62c581.png)
![*[点击查看完整图片]*](https://i-blog.csdnimg.cn/direct/887f3f7668e9477999ecd99b75613b4c.png)

所有评论(0)