【基于TAI指数的中国多场景林火识别研究】

weixin_40744387

401人浏览 · 2026-05-15 19:58:58

weixin_40744387 · 2026-05-15 19:58:58 发布

摘要
基于TAI（三波段热异常指数，Thermal Anomaly Index）构建了TAI动态阙値法+随机森林（RF）+XGBoost多方法对比框架，对中国五大典型林区（大兴安岭针叶林、云南亚热带阔叶林、秦岭混交林、东北林农交错区、西南山区云雾条件）开展了系统化的林火检测与精度验证实验。研究采用Sentinel-2 MSI L2A影像（20m分辨率）作为输入数据，以NASA FIRMS VIIRS/MODIS主动火点产品作为训练标签和验证参考，通聴5折分层交叉验证评估模型性能。消融实验结果表明，TAI特征对RF分类器在云雾场景下带来约1.2%的Kappa提升。交叉验证Kappa在各场景中为0.25至0.74，其中秦岭混交林场景表现最佳（RF CV Kappa=0.728，XGB CV Kappa=0.738）。

一、研究背景与目的
森林火灾是全球最具破坏性的自然灾害之一，对生态系统、碳循环和人类社会具有严重影响。中国幅员辽阔，林区类型多样，各林区火灾发生规律、植被燃烧特性和遥感观测条件存在显著差异。
TAI（Thermal Anomaly Index）由Liu et al.（2021）提出，利用Sentinel-2 MSI的B8A（865nm近红外）、B11（1610nm短波红夜1）、B12（2190nm短波红夜2）三个波段构建热异常指数，能够有效区分高温异常像元与正常植被背景。本研究首次将TAI系统化应用于中国多类型林火场景，构建 TAI动态阙値自适应模型，并提出TAI+ML联合检测框架，通过消融实验量化TAI特征对ML分类器的增益贡献。
1.1 研究目标
（1）将TAI指数系统化应用于中国五大典型林区火灾检测；
（2）构建针对不同林型的TAI动态阙値自适应模型；
（3）提出 TAI+ML（随机森林/XGBoost）联合检测框架；
（4）通过消融实验量化TAI特征贡献，建立完善的精度验证体系。
1.2 TAI指数原理
TAI指数基于火灾高温像元在短波红夜波段（SWIR）反射率显著升高的物理机制，定义如下：
TAI = (rho_B12 - rho_B11) / rho_B8A
双特征判据：
特征一（Feature 1）：(rho_B12 - rho_B11) / rho_B8A >= 0.45
特征二（Feature 2）：(rho_B12 - rho_B11) >= (rho_B11 - rho_B8A)
其中rho表示地表反射率。火灾高温区域因辐射能量显著增强，导致B12和B11波段反射率远高于正常植被，而B8A波段受火焰影响相对较小，从而使TAI值异常偏高，形成可识别的热异常特征。

二、数据来源与下载方法
2.1 Sentinel-2 MSI 影像
本研究使用欧空局（ESA）Sentinel-2 MSI L2A地表反射率产品（Google Earth Engine数据集：COPERNICUS/S2_SR_HARMONIZED）。数据通过Google Earth Engine（GEE）Python API下载。
在这里插入图片描述

2.2 NASA FIRMS 主动火点数据
FIRMS（Fire Information for Resource Management System）火点数据通过NASA FIRMS REST API下载，使用VIIRS_SNPP_SP和MODIS_SP两种数据源。API端点：https://firms.modaps.eosdis.nasa.gov/api/area/csv。本研究使用nominal及以上置信度的火点记录作为训练标签和验证参考。下载策略：按5天时间窗口分批循环请求（API每次5天上限），通过滞动窗口速率限制器自动处理API限速（每10分钟5000条上限）；当单次返回条数>=4900时，自动拆分为单日窗口重新请求以防止数据截断。
FIRMS火点在Sentinel-2像元网格上栈格化（缓冲1像元）后作为ML训练标签，同时用于精度验证的参考真値。
2.3 五大研究场景参数
在这里插入图片描述

三、技术方案
3.1 整体框架
本研究构建了三种并行的林火检测路线：
方法A（TAI动态阙値法）：直接对TAI连续値应用自适应阙値，结合B12辅助判据，输出二値火点掩膜；
方法B（随机森林，RF）：以TAI特征+光谱特征+衍生指数共12维13维特征训练RF分类器；
方法C（XGBoost）：采用与RF相同的12维特征集，训练梯度提升树分类器。
3.2 TAI动态阙値算法
动态阙値算法基于背景像元的鲁棒统计量自动确定检测阙値，消除不同场景、不同时相间的系统性偏差。算法流程：
（1）计算全图TAI値，使用FIRMS已知火点（缓冲5像元）构建火点排除掩膜；
（2）在排除火点区域的有效背景像元上计算中位数（Median）和中位绝对偏差（MAD）；
（3）将MAD转换为等效标准差：sigma_MAD = 1.4826 * MAD；
（4）动态阙値：T = Median + n * sigma_MAD（n为场景自适应系数）；
（5）判别条件：TAI >= T 且 B12 >= 0.1（辅助SWIR辐射判据）；
（6）对检测结果进行形态学后处理（开运算去噪），输出最终火点掩膜。
3.3 ML特征工程
ML分类器使用以下12维特征（三组）：
在这里插入图片描述

3.4 ML模型超参数
在这里插入图片描述

3.5 训练策略与精度评估
正负样本采样：以FIRMS栈格化火点（缓冲1像元）为正样本，按1:3比例在背景区域随机采样负样本；
交叉验证：5折分层交叉验证（StratifiedKFold），以Kappa系数、准确率、F1分数、ROC-AUC为评估指标；
精度验证指标：总体精度（OA）、Kappa系数、火点制图精度（PA_fire）、用户精度（UA_fire）、F1分数；
消融实验：对比全12维特征（含TAI）与9维特征（去TAI组）的CV Kappa差异，量化TAI特征对ML模型的贡献度。

四、实验结果
4.1 交叉验证精度
在这里插入图片描述

4.2 全图精度评估（基于FIRMS参考）
表4-2为五个场景中三种方法在全图尺度上的精度评估结果（以FIRMS为参考）。由于FIRMS火点像元数量相对于Sentinel-2全图总像元数极为稀少，全图精度OA和Kappa受严重类别不平衡影响，应重点关注PA_fire（召回率）与UA_fire（精确率）指标。
在这里插入图片描述

4.3 消融实验结果
消融实验通过对比“全特征（12维含TAI）”与“去TAI特征（9维）”的CV Kappa差异，量化TAI特征对机器学习分类器的增益贡献。
在这里插入图片描述

五、结果图表
5.1 精度对比图

在这里插入图片描述

图5-2 各场景各方法Kappa系数热力图
在这里插入图片描述

5.2 消融实验对比

图5-3 消融实验结果对比图（全特征 vs 去TAI特征，CV Kappa差异）
在这里插入图片描述

5.3 特征重要性

图5-4 随机森林特征重要性排序（大兴安岭场景）
在这里插入图片描述
图5-5 XGBoost特征重要性排序（大兴安岭场景）

在这里插入图片描述
图5-6 随机森林特征重要性排序（东北林农交错区场景）

在这里插入图片描述
图5-7 XGBoost特征重要性排序（东北林农交错区场景）

5.4 火点检测对比图（各场景）

图5-8 大兴安岭针叶林场景火点检测结果对比
在这里插入图片描述
图5-9 云南亚热带阔叶林场景火点检测结果对比

图5-10 秦岭混交林场景火点检测结果对比
在这里插入图片描述

图5-11 东北林农交错区场景火点检测结果对比

在这里插入图片描述
图5-12 西南山区云雾条件场景火点检测结果对比

5.5 雷达图（各场景精度综合对比）

图5-13 大兴安岭场景精度雷达图
在这里插入图片描述

图5-14 云南场景精度雷达图
在这里插入图片描述

图5-15 秦岭场景精度雷达图

在这里插入图片描述
图5-16 东北林农交错区精度雷达图

图5-17 西南云雾区精度雷达图

在这里插入图片描述

六、结果讨论
6.1 TAI动态阙値法表现分析
TAI动态阙値法在全图精度评估中OA极高（>0.9999），但Kappa系数接近零甚至为负値，PA_fire和UA_fire均为零。这主要源于类别极度不平衡问题：在数千万有效像元中，FIRMS参考火点仅有数十至数千个，仅占像元总量的0.001%以下。在此背景下，阙値法实际上将几乎所有像元预测为非火，从而获得极高OA但完全丢失火点的检测能力。这并不意味着动态阙値法本身无效，而是反映了以FIRMS为参考对全图进行精度评估时的固有局限性。
6.2 ML方法的交叉验证Kappa分析
交叉验证Kappa（基于训练样本集）更能反映模型的实际区分能力。秦岭混交林场景CV Kappa最高（RF=0.728，XGB=0.738），表明在该场景下ML方法可有效识别火点与背景的光谱差异。云南和西南云雾区场景 CV Kappa较低（0.25-0.37），可能与云雾干扰导致火点光谱特征不稳定、以及阔叶林背景与火点光谱相似度较高有关。
6.3 TAI特征消融结果
消融实验结果显示：TAI特征对RF在西南云雾区有约+1.2%的Kappa提升，对东北林农交错区有微弱正效应（+0.05%）。而XGBoost在两个场景中去TAI特征后Kappa反而略有提高，可能反映了以下情况：（1）TAI特征与其他衍生指数（diff_of_diff、B12_B11_ratio）存在较高的信息冒余，对XGBoost的增益有限；（2）XGBoost本身在特征选择上更加自适应，能从9维子集中获得类似的判别效果。总体而言，TAI特征在RF框架下表现出一定正贡献，支持了本研究的核心假设。
6.4 大兴安岭场景的特殊性
大兴安岭场景的CV Kappa=1.000（完美分类），但这是典型的过拟合现象，原因是FIRMS在该研究时段和AOI范围内有效火点极少（仇27个正样本），5折交叉验证中每折验证集仅含5-6个正样本，极小的验证集使Kappa统计量失去稳定性。大兴安岭场景的结果不应用于方法有效性的一般性结论。

七、参考文献
[1] Liu, Z., Yao, Z., & Wang, R. (2021). Detecting high-temperature anomalies from Sentinel-2 MSI images. ISPRS Journal of Photogrammetry and Remote Sensing, 177, 174-193.
[2] Giglio, L., Schroeder, W., & Justice, C. O. (2016). The collection 6 MODIS active fire detection algorithm and fire products. Remote Sensing of Environment, 178, 31-41.
[3] Schroeder, W., Oliva, P., Giglio, L., & Csiszar, I. A. (2014). The New VIIRS 375 m active fire detection data product: Algorithm description and initial assessment. Remote Sensing of Environment, 143, 85-96.
[4] Gorelick, N., et al. (2017). Google Earth Engine: Planetary-scale geospatial analysis for everyone. Remote Sensing of Environment, 202, 18-27.
[5] Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5-32.
[6] Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of KDD 2016, 785-794.
[7] Cohen, J. (1960). A coefficient of agreement for nominal scales. Educational and Psychological Measurement, 20(1), 37-46.