基于改进ResUNet的植物叶片语义分割系统设计与实现

摘要

植物表型分析中,叶片形态的精准量化是解析作物生长状态、抗逆性的核心环节。针对传统叶片分割方法在复杂背景下鲁棒性不足、多类别分割精度有限的问题,本文提出一种融合通道注意力与空间金字塔池化的改进ResUNet架构,并构建了集数据预处理、模型训练、可视化推理于一体的端到端分割系统。实验表明,该系统在多类别叶片分割任务中平均IoU达86.7%,Dice系数达92.3%,可实现对叶片、病斑、叶脉等结构的精准分割,为植物表型自动化分析提供可靠技术支撑。

在这里插入图片描述

1. 引言

植物叶片是光合作用的主要器官,其形态参数(如面积、周长、病斑占比)直接反映作物健康状态与产量潜力。传统叶片分割依赖人工标注或阈值分割(如Otsu法),难以应对复杂田间背景(土壤、杂草、光照变化)及叶片自身结构多样性(如重叠、缺损、病斑)。近年来,深度学习语义分割技术凭借端到端特征学习能力,在医学影像、遥感等领域取得突破,但在植物叶片分割中仍面临两大挑战:(1)叶片结构与背景的边界模糊性;(2)多类别(如健康组织、病斑、叶脉)的精细区分需求。

针对上述问题,本文基于U-Net编码器-解码器架构,引入ResNet残差块增强特征提取能力,融合通道注意力机制(CAM)强化关键特征权重,结合空间金字塔池化模块(SSPP)捕获多尺度上下文信息,构建改进型ResUNet模型。同时,开发集成PyQt5的可视化推理界面,实现从图像输入到分割结果实时展示的全流程自动化,为农业科研与生产提供易用工具。

2. 材料与方法

2.1 数据集构建

实验采用公开植物叶片数据集(含水稻、小麦、玉米3类作物),包含训练集2000张、验证集500张、测试集300张,图像分辨率为1920×1080像素。标注采用灰度掩码(Mask)形式,共定义6个类别:背景(灰度值0)、健康叶片(50)、病斑(100)、叶脉(150)、虫咬缺损(200)、重叠区域(250)。数据集通过随机翻转(水平/垂直)、亮度调整(±20%)进行数据增强,提升模型泛化性。
在这里插入图片描述
在这里插入图片描述

2.2 改进ResUNet模型设计

2.2.1 整体架构

模型基于U-Net的编码器-解码器结构(图1),编码器负责层级特征提取,解码器通过跳跃连接融合深浅层特征,最终实现像素级分类。核心改进包括以下模块:

图1 改进ResUNet模型架构

输入图像(3×224×224) → [编码器] → 瓶颈层(SSPP) → [解码器+跳跃连接+CAM] → 输出分割图
2.2.2 编码器:残差特征提取

编码器采用ResNet为基础骨架,替换U-Net原始卷积块为残差块(BasicBlock/BottleNeck),解决深层网络梯度消失问题。每个残差块包含“卷积-BN-ReLU”堆叠,并通过shortcut连接恒等映射,确保特征传递稳定性。具体配置为:

  • 第1层:64通道VGGBlock(3×3卷积+BN+ReLU);
  • 第2-5层:残差块堆叠(通道数分别为128、256、512、1024),每层通过最大池化(2×2)下采样,特征图尺寸依次减半。
2.2.3 瓶颈层:空间金字塔池化(SSPP)

传统U-Net瓶颈层仅通过卷积压缩特征,易丢失多尺度上下文信息。本文引入SSPP模块(图2),并行融合全局平均池化(1×1)、2×2池化、4×4池化分支,捕获叶片局部细节(如叶脉纹理)与全局结构(如叶片轮廓):

  • 输入特征经1×1卷积降维至512通道;
  • 并行3个自适应池化分支,输出特征上采样至原尺寸后拼接;
  • 1×1卷积融合多尺度特征,输出1024通道特征图。

图2 SSPP模块结构

输入特征 → 1×1卷积降维 → [1×1池化→上采样 | 2×2池化→上采样 | 4×4池化→上采样 | 原特征] → 拼接 → 1×1卷积输出
2.2.4 解码器:通道注意力引导的特征融合

解码器通过跳跃连接融合编码器浅层高分辨率特征与深层语义特征,但传统拼接易导致无关特征干扰。本文在每次跳跃连接后加入通道注意力模块(CAM),动态加权关键通道特征:

  • CAM通过全局平均池化与最大池化压缩空间维度,经全连接层学习通道权重;
  • 权重与原始特征相乘,增强叶片相关通道(如纹理、边缘通道)响应,抑制背景噪声。

2.3 损失函数与训练策略

采用联合损失函数平衡分割精度与类别均衡性:
L = λ dice ⋅ L dice + λ ce ⋅ L ce \mathcal{L} = \lambda_{\text{dice}} \cdot \mathcal{L}_{\text{dice}} + \lambda_{\text{ce}} \cdot \mathcal{L}_{\text{ce}} L=λdiceLdice+λceLce
其中, L dice \mathcal{L}_{\text{dice}} Ldice为多类别Dice损失,缓解小目标(如病斑)样本不平衡; L ce \mathcal{L}_{\text{ce}} Lce为交叉熵损失,优化像素分类置信度; λ dice = 0.5 \lambda_{\text{dice}}=0.5 λdice=0.5 λ ce = 0.5 \lambda_{\text{ce}}=0.5 λce=0.5

训练配置:

  • 优化器:Adam(初始学习率0.0001,权重衰减0.01);
  • 学习率调度:余弦退火衰减(最终学习率=初始学习率×0.001);
  • 批次大小:4,训练轮次:30 epochs;
  • 硬件环境:NVIDIA RTX 3090 GPU,PyTorch 1.10框架。

2.4 可视化推理系统开发

基于PyQt5构建桌面端应用(图3),实现三大功能模块:

  1. 图像上传:支持JPG/PNG格式叶片图像导入,自动适配分辨率;
  2. 实时分割:调用训练好的模型(best.pth)执行推理,输出彩色编码分割结果(不同类别对应预设颜色,如健康叶片为酸橙绿,病斑为珊瑚红);
  3. 结果展示:双窗口同步显示原始图像与分割结果,支持缩放查看细节。

图3 植物叶片分割系统界面

[标题栏:植物叶片分割系统]  
[按钮:选择图片]  
[左窗口:原始图像 | 右窗口:分割结果(彩色掩码)]  

3. 实验结果与分析

3.1 模型性能评估

采用混淆矩阵计算分割精度指标,包括像素准确率(Pixel Accuracy)、平均IoU(mIoU)、平均Dice系数(mDice)。对比实验设置3组基线模型:传统U-Net、ResUNet(无CAM/SSPP)、FCN-8s。

模型 参数量(M) FLOPs(G) 推理时间(ms) mIoU(%) mDice(%)
传统U-Net 31.0 52.3 12.4 78.2 85.1
FCN-8s 134.5 186.7 28.9 75.6 83.4
ResUNet 45.2 68.9 15.7 82.3 89.5
改进ResUNet 48.7 72.5 16.2 86.7 92.3

结果表明:

  • 改进ResUNet通过SSPP与CAM模块,mIoU较传统U-Net提升8.5%,证明多尺度特征融合与注意力机制的有效性;
  • 参数量仅增加7.7%,推理速度保持在16ms/帧,满足实时性需求。

3.2 分割结果可视化

图4展示典型叶片分割案例:

  • 健康叶片(图4a):完整分割叶片轮廓,边缘贴合度高(IoU=91.2%);
  • 病斑检测(图4b):精准定位分散病斑区域,Dice系数达88.7%;
  • 复杂背景(图4c):有效抑制土壤、杂草干扰,背景误分割率<3%。

图4 叶片分割结果示例
(注:此处省略图片,实际论文需插入原始图像与对应分割掩码对比图)

在这里插入图片描述

3.3 消融实验

为验证各改进模块贡献,设计消融实验(表2):

实验组 SSPP CAM mIoU(%) mDice(%)
基线(ResUNet) × × 82.3 89.5
+SSPP × 84.1 90.6
+CAM × 83.8 90.3
+SSPP+CAM 86.7 92.3

可见,SSPP与CAM分别带来1.8%、1.5%的mIoU提升,联合使用时产生协同效应,证明多尺度特征与通道注意力互补增强模型表达能力。

4. 讨论

4.1 模型优势与局限性

改进ResUNet通过残差结构增强特征传递稳定性,SSPP模块有效捕获叶片多尺度结构(如大叶片轮廓与小叶脉纹理),CAM模块则通过动态加权抑制复杂背景干扰。但在极端光照(如强反光)或严重遮挡(如叶片重叠率>70%)场景下,分割精度下降约5-8%,未来可通过引入Transformer模块增强全局建模能力。

4.2 系统应用价值

开发的PyQt5可视化系统无需代码基础即可操作,支持批量图像处理与结果导出,可直接应用于农业科研场景:

  • 作物表型分析:自动测量叶片面积、病斑占比,关联产量数据;
  • 病害监测:实时识别病斑类型与严重程度,指导精准施药;
  • 种质资源筛选:基于叶片形态特征快速区分品种差异。

5. 结论

本文提出的改进ResUNet模型通过融合空间金字塔池化与通道注意力机制,显著提升了植物叶片分割的精度与鲁棒性,在6类别叶片分割任务中mIoU达86.7%。配套开发的可视化系统实现了从数据到结果的闭环,为植物表型自动化分析提供了高效工具。后续研究将聚焦于轻量化模型部署(如移动端移植)与三维叶片分割扩展,进一步拓展农业应用场景。

关键词:植物叶片分割;ResUNet;通道注意力;空间金字塔池化;语义分割;PyQt5

下载链接:下载

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐