摘 要
基于TAI(三波段热异常指数,Thermal Anomaly Index)构建了TAI动态阙値法+随机森林(RF)+XGBoost多方法对比框架,对中国五大典型林区(大兴安岭针叶林、云南亚热带阔叶林、秦岭混交林、东北林农交错区、西南山区云雾条件)开展了系统化的林火检测与精度验证实验。研究采用Sentinel-2 MSI L2A影像(20m分辨率)作为输入数据,以NASA FIRMS VIIRS/MODIS主动火点产品作为训练标签和验证参考,通聴5折分层交叉验证评估模型性能。消融实验结果表明,TAI特征对RF分类器在云雾场景下带来约1.2%的Kappa提升。交叉验证Kappa在各场景中为0.25至0.74,其中秦岭混交林场景表现最佳(RF CV Kappa=0.728,XGB CV Kappa=0.738)。

一、研究背景与目的
森林火灾是全球最具破坏性的自然灾害之一,对生态系统、碳循环和人类社会具有严重影响。中国幅员辽阔,林区类型多样,各林区火灾发生规律、植被燃烧特性和遥感观测条件存在显著差异。
TAI(Thermal Anomaly Index)由Liu et al.(2021)提出,利用Sentinel-2 MSI的B8A(865nm近红外)、B11(1610nm短波红夜1)、B12(2190nm短波红夜2)三个波段构建热异常指数,能够有效区分高温异常像元与正常植被背景。本研究首次将TAI系统化应用于中国多类型林火场景,构建 TAI动态阙値自适应模型,并提出TAI+ML联合检测框架,通过消融实验量化TAI特征对ML分类器的增益贡献。
1.1 研究目标
(1)将TAI指数系统化应用于中国五大典型林区火灾检测;
(2)构建针对不同林型的TAI动态阙値自适应模型;
(3)提出 TAI+ML(随机森林/XGBoost)联合检测框架;
(4)通过消融实验量化TAI特征贡献,建立完善的精度验证体系。
1.2 TAI指数原理
TAI指数基于火灾高温像元在短波红夜波段(SWIR)反射率显著升高的物理机制,定义如下:
TAI = (rho_B12 - rho_B11) / rho_B8A
双特征判据:
特征一(Feature 1):(rho_B12 - rho_B11) / rho_B8A >= 0.45
特征二(Feature 2):(rho_B12 - rho_B11) >= (rho_B11 - rho_B8A)
其中rho表示地表反射率。火灾高温区域因辐射能量显著增强,导致B12和B11波段反射率远高于正常植被,而B8A波段受火焰影响相对较小,从而使TAI值异常偏高,形成可识别的热异常特征。

二、数据来源与下载方法
2.1 Sentinel-2 MSI 影像
本研究使用欧空局(ESA)Sentinel-2 MSI L2A地表反射率产品(Google Earth Engine数据集:COPERNICUS/S2_SR_HARMONIZED)。数据通过Google Earth Engine(GEE)Python API下载。
在这里插入图片描述

2.2 NASA FIRMS 主动火点数据
FIRMS(Fire Information for Resource Management System)火点数据通过NASA FIRMS REST API下载,使用VIIRS_SNPP_SP和MODIS_SP两种数据源。API端点:https://firms.modaps.eosdis.nasa.gov/api/area/csv。本研究使用nominal及以上置信度的火点记录作为训练标签和验证参考。下载策略:按5天时间窗口分批循环请求(API每次5天上限),通过滞动窗口速率限制器自动处理API限速(每10分钟5000条上限);当单次返回条数>=4900时,自动拆分为单日窗口重新请求以防止数据截断。
FIRMS火点在Sentinel-2像元网格上栈格化(缓冲1像元)后作为ML训练标签,同时用于精度验证的参考真値。
2.3 五大研究场景参数
在这里插入图片描述

三、技术方案
3.1 整体框架
本研究构建了三种并行的林火检测路线:
方法A(TAI动态阙値法):直接对TAI连续値应用自适应阙値,结合B12辅助判据,输出二値火点掩膜;
方法B(随机森林,RF):以TAI特征+光谱特征+衍生指数共12维13维特征训练RF分类器;
方法C(XGBoost):采用与RF相同的12维特征集,训练梯度提升树分类器。
3.2 TAI动态阙値算法
动态阙値算法基于背景像元的鲁棒统计量自动确定检测阙値,消除不同场景、不同时相间的系统性偏差。算法流程:
(1)计算全图TAI値,使用FIRMS已知火点(缓冲5像元)构建火点排除掩膜;
(2)在排除火点区域的有效背景像元上计算中位数(Median)和中位绝对偏差(MAD);
(3)将MAD转换为等效标准差:sigma_MAD = 1.4826 * MAD;
(4)动态阙値:T = Median + n * sigma_MAD(n为场景自适应系数);
(5)判别条件:TAI >= T 且 B12 >= 0.1(辅助SWIR辐射判据);
(6)对检测结果进行形态学后处理(开运算去噪),输出最终火点掩膜。
3.3 ML特征工程
ML分类器使用以下12维特征(三组):
在这里插入图片描述

3.4 ML模型超参数
在这里插入图片描述

3.5 训练策略与精度评估
正负样本采样:以FIRMS栈格化火点(缓冲1像元)为正样本,按1:3比例在背景区域随机采样负样本;
交叉验证:5折分层交叉验证(StratifiedKFold),以Kappa系数、准确率、F1分数、ROC-AUC为评估指标;
精度验证指标:总体精度(OA)、Kappa系数、火点制图精度(PA_fire)、用户精度(UA_fire)、F1分数;
消融实验:对比全12维特征(含TAI)与9维特征(去TAI组)的CV Kappa差异,量化TAI特征对ML模型的贡献度。

四、实验结果
4.1 交叉验证精度
在这里插入图片描述

4.2 全图精度评估(基于FIRMS参考)
表4-2为五个场景中三种方法在全图尺度上的精度评估结果(以FIRMS为参考)。由于FIRMS火点像元数量相对于Sentinel-2全图总像元数极为稀少,全图精度OA和Kappa受严重类别不平衡影响,应重点关注PA_fire(召回率)与UA_fire(精确率)指标。
在这里插入图片描述

4.3 消融实验结果
消融实验通过对比“全特征(12维含TAI)”与“去TAI特征(9维)”的CV Kappa差异,量化TAI特征对机器学习分类器的增益贡献。
在这里插入图片描述

五、结果图表
5.1 精度对比图

在这里插入图片描述

图5-2 各场景各方法Kappa系数热力图
在这里插入图片描述

5.2 消融实验对比

图5-3 消融实验结果对比图(全特征 vs 去TAI特征,CV Kappa差异)
在这里插入图片描述

5.3 特征重要性

图5-4 随机森林特征重要性排序(大兴安岭场景)
在这里插入图片描述
图5-5 XGBoost特征重要性排序(大兴安岭场景)

在这里插入图片描述
图5-6 随机森林特征重要性排序(东北林农交错区场景)

在这里插入图片描述
图5-7 XGBoost特征重要性排序(东北林农交错区场景)在这里插入图片描述

5.4 火点检测对比图(各场景)

图5-8 大兴安岭针叶林场景火点检测结果对比
在这里插入图片描述
图5-9 云南亚热带阔叶林场景火点检测结果对比
在这里插入图片描述

图5-10 秦岭混交林场景火点检测结果对比
在这里插入图片描述

图5-11 东北林农交错区场景火点检测结果对比

在这里插入图片描述
图5-12 西南山区云雾条件场景火点检测结果对比在这里插入图片描述

5.5 雷达图(各场景精度综合对比)

图5-13 大兴安岭场景精度雷达图
在这里插入图片描述

图5-14 云南场景精度雷达图
在这里插入图片描述

图5-15 秦岭场景精度雷达图

在这里插入图片描述
图5-16 东北林农交错区精度雷达图在这里插入图片描述

图5-17 西南云雾区精度雷达图

在这里插入图片描述

六、结果讨论
6.1 TAI动态阙値法表现分析
TAI动态阙値法在全图精度评估中OA极高(>0.9999),但Kappa系数接近零甚至为负値,PA_fire和UA_fire均为零。这主要源于类别极度不平衡问题:在数千万有效像元中,FIRMS参考火点仅有数十至数千个,仅占像元总量的0.001%以下。在此背景下,阙値法实际上将几乎所有像元预测为非火,从而获得极高OA但完全丢失火点的检测能力。这并不意味着动态阙値法本身无效,而是反映了以FIRMS为参考对全图进行精度评估时的固有局限性。
6.2 ML方法的交叉验证Kappa分析
交叉验证Kappa(基于训练样本集)更能反映模型的实际区分能力。秦岭混交林场景CV Kappa最高(RF=0.728,XGB=0.738),表明在该场景下ML方法可有效识别火点与背景的光谱差异。云南和西南云雾区场景 CV Kappa较低(0.25-0.37),可能与云雾干扰导致火点光谱特征不稳定、以及阔叶林背景与火点光谱相似度较高有关。
6.3 TAI特征消融结果
消融实验结果显示:TAI特征对RF在西南云雾区有约+1.2%的Kappa提升,对东北林农交错区有微弱正效应(+0.05%)。而XGBoost在两个场景中去TAI特征后Kappa反而略有提高,可能反映了以下情况:(1)TAI特征与其他衍生指数(diff_of_diff、B12_B11_ratio)存在较高的信息冒余,对XGBoost的增益有限;(2)XGBoost本身在特征选择上更加自适应,能从9维子集中获得类似的判别效果。总体而言,TAI特征在RF框架下表现出一定正贡献,支持了本研究的核心假设。
6.4 大兴安岭场景的特殊性
大兴安岭场景的CV Kappa=1.000(完美分类),但这是典型的过拟合现象,原因是FIRMS在该研究时段和AOI范围内有效火点极少(仇27个正样本),5折交叉验证中每折验证集仅含5-6个正样本,极小的验证集使Kappa统计量失去稳定性。大兴安岭场景的结果不应用于方法有效性的一般性结论。

七、参考文献
[1] Liu, Z., Yao, Z., & Wang, R. (2021). Detecting high-temperature anomalies from Sentinel-2 MSI images. ISPRS Journal of Photogrammetry and Remote Sensing, 177, 174-193.
[2] Giglio, L., Schroeder, W., & Justice, C. O. (2016). The collection 6 MODIS active fire detection algorithm and fire products. Remote Sensing of Environment, 178, 31-41.
[3] Schroeder, W., Oliva, P., Giglio, L., & Csiszar, I. A. (2014). The New VIIRS 375 m active fire detection data product: Algorithm description and initial assessment. Remote Sensing of Environment, 143, 85-96.
[4] Gorelick, N., et al. (2017). Google Earth Engine: Planetary-scale geospatial analysis for everyone. Remote Sensing of Environment, 202, 18-27.
[5] Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5-32.
[6] Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of KDD 2016, 785-794.
[7] Cohen, J. (1960). A coefficient of agreement for nominal scales. Educational and Psychological Measurement, 20(1), 37-46.

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐