论文精读:过去十年计算机视觉与深度学习在作物生长管理中的核心技术方法
计算机视觉与深度学习如何革新作物生长管理?——十年进展全解读
一、引言
农业是人类生存的基础产业,但当前面临劳动力短缺、资源紧张、气候变化等多重挑战。传统农业依赖经验判断和人工劳作,效率低、成本高。幸运的是,计算机视觉和深度学习的快速发展,正在将农业生产从“看天吃饭”推向“无人化、智能化”的时代。本文基于Cao等人2025年发表于Applied Sciences上的综述,系统梳理过去十年计算机视觉与深度学习在作物生长管理中的核心技术方法,并聚焦作物识别、分级分类、病害监测、杂草检测四大应用方向。

二、核心技术方法详解
2.1 计算机视觉传感器:农业的“眼睛”
计算机视觉的第一步是获取高质量的图像数据。不同传感器适用于不同场景:
| 传感器类型 | 工作原理 | 优势 | 局限性 | 农业应用实例 |
|---|---|---|---|---|
| 单目相机 | 单摄像头采集RGB图像 | 成本低、结构简单 | 无法直接获取深度 | 作物分级、灌溉指导 |
| 立体视觉相机 | 双/多相机模拟人眼视差 | 可输出RGB+深度信息 | 对低纹理物体效果差 | 株高测量、杂草3D定位 |
| 结构光相机 | 投影编码光斑,计算变形 | 弱纹理物体效果好 | 强光下易受干扰 | 植物三维重建 |
| 高光谱/多光谱相机 | 连续窄带/离散宽带成像 | 光谱信息丰富,可检测生化成分 | 数据量大、成本高 | 病害早期诊断、养分监测 |
| 红外热像仪 | 探测物体热辐射 | 非接触测温,穿透烟雾/光照影响小 | 分辨率相对较低 | 作物水分胁迫、病虫害发热检测 |
💡 代码示例:使用OpenCV读取双目图像并计算视差图
import cv2
import numpy as np
# 读取左右图像(灰度)
imgL = cv2.imread('left.jpg', 0)
imgR = cv2.imread('right.jpg', 0)
# 创建StereoSGBM匹配器
stereo = cv2.StereoSGBM_create(
minDisparity=0,
numDisparities=64, # 视差范围
blockSize=11,
P1=8*3*11**2,
P2=32*3*11**2,
disp12MaxDiff=1,
uniquenessRatio=10,
speckleWindowSize=100,
speckleRange=32
)
disparity = stereo.compute(imgL, imgR).astype(np.float32) / 16.0
cv2.imwrite('disparity.png', disparity)
print("视差图已保存")
2.2 深度学习模型:农业的“大脑”
2.2.1 注意力机制
受人类视觉启发,注意力机制让模型聚焦于图像中的关键区域。最经典的包括:
- Squeeze-and-Excitation (SE) 模块:对每个通道进行全局平均池化,学习通道权重,增强重要通道特征。
- 多头自注意力:Transformer的基础,同时关注不同位置的依赖关系。
应用案例:在桃树开花密度估计中,引入注意力模块后,模型能更有效地聚焦花朵细节,抑制背景干扰(Tao et al., 2022)。
2.2.2 Transformer及其变体
Transformer最初用于自然语言处理,其自注意力机制可以捕获全局依赖。2020年Vision Transformer (ViT) 将其引入图像领域,随后涌现出Swin Transformer、Cross‑Former等变体。
农业优势:作物病害区域通常分散且形态多变,Transformer能建立远距离特征联系。例如,将Transformer编码器嵌入轻量级CNN中,可在复杂背景下提取病害全局特征(Zhu et al., 2022)。
2.2.3 图像分割与目标检测模型
- 目标检测:YOLO系列(YOLOv4~YOLOv10)是一阶段检测器,速度快,广泛应用于果实检测、杂草识别。Mask R‑CNN则提供实例分割。
- 图像分割:U‑Net常用于农田遥感分割;DeepLab系列通过空洞卷积扩大感受野。
典型改进:
- 为适应小目标检测(如早期害虫),使用多尺度特征融合(FPN、BiFPN)和注意力引导的特征加权。
- 为轻量化部署,采用深度可分离卷积(MobileNet)、SPD‑Conv等方法。
💡 代码示例:使用YOLOv8训练作物检测模型(伪代码)
from ultralytics import YOLO
# 加载预训练模型
model = YOLO('yolov8n.pt') # nano版本适合移动端
# 训练(需准备数据集,格式为YOLO)
results = model.train(
data='crop_dataset.yaml',
epochs=50,
imgsz=640,
batch=16,
device=0, # GPU编号
project='crop_detection',
name='exp1'
)
# 验证
metrics = model.val()
print(f"mAP50: {metrics.box.map50:.3f}")
# 导出为ONNX/TFLite用于边缘设备
model.export(format='onnx') # 或 'tflite'
三、四大应用方向详解
3.1 作物识别与检测
核心挑战:背景复杂(杂草、土壤)、光照变化、果实遮挡、夜间作业。
典型方法:
- YOLO系列改进:替换骨干网络为轻量型(如MobileNetV3)、增加注意力机制、使用多尺度特征融合。
- 密度估计:除了检测目标,还通过核密度估计(KDE)分析果实空间分布,指导种植密度(如草莓分布估计)。
代表成果:
- 苹果检测:改进YOLOv4,模型大小缩减87.8%,mAP仍达93.42%(Ji et al., 2021)。
- 全天气茶芽检测:加入坐标注意力,夜间精度仅比最佳光照下降0.76%(Zhang et al., 2023)。
3.2 作物分级分类
核心挑战:叶片型作物(茶叶、烟草)形态相似、重叠粘连;果实需多角度评估。
典型方法:
- 双分支网络:全局分支(整体特征)+ 局部分支(高分辨率局部块)加权融合。
- 注意力增强:SE模块、CBAM模块强化关键质量特征。
- 生成对抗网络(DCGAN) 扩充样本,提升小样本下的分级精度。
代表成果:
- 烟草动态分级:双分支模型+FPN+CBAM,动态生产线准确率91.30%(Lu et al., 2023)。
- 苹果多视角分级:融合Swin Transformer的窗口自注意力,轻量化同时保持高精度。
3.3 病害监测
核心挑战:早期病斑微小、症状不明显;不同病害表现相似;需兼顾植物病害与虫害。
典型方法:
- 多尺度特征融合:RepGFPN、BiFPN等融合浅层细节与深层语义,增强小病灶检测。
- CNN+Transformer双分支:分别提取局部纹理和全局上下文,动态融合后分类。
- 结合传统特征:LBP纹理 + 深度学习特征,用于多类病害识别。
代表成果:
- 辣椒疫病检测:YOLOv8-GDCI(RepGFPN+CoordAtt+动态上采样),mAP达88.9%(Duan et al., 2024)。
- 水稻病害识别:离线+在线双模式,适应弱网络环境(Yang et al., 2022)。
- 小型飞行害虫检测:YOLO-SIP(滑动窗口+EfficientNetV2),解决小目标畸变问题。
3.4 杂草检测
核心挑战:杂草形态多样、与作物相似、密集重叠。
典型方法:
- 轻量化检测器:YOLOv5改进(HGNetV2 + SSFF + TFE + DyHead),实现高精度低延迟。
- Swin Transformer嵌入:增强全局上下文,改善遮挡下杂草识别。
- 多特征融合:颜色矩+GLCM+LBP+Hu矩→BP神经网络,用于芦笋田杂草识别。
代表成果:
- 油菜田杂草检测:YOLOv5 + Swin Transformer + BiFPN + NAM,mAP90.8%(Tao & Wei, 2024)。
- 棉田杂草分割:多极特征加权融合+跨层融合,mIoU达0.9164(Lu et al., 2025)。
四、实际案例:智能农场部署
以江苏某33公顷智慧农场为例,采用“无人机巡查+地面精准喷洒”方案:
- 设备:大疆Matrice 350 RTK(多光谱相机)+ 边缘计算工控机(RTX A5000)+ 变量喷施系统。
- 成本:初期约4万美元(设备、软件授权、培训)。
- 效果:农药用量从180 L/ha降至99 L/ha(降45%),除草效率从133 m²/h提升至5300 m²/h(增39倍),产量提升5%,2~3年收回投资。
- 操作限制:强光下需在早9点前/晚5点后作业,湿度>85%需防水保护。
五、当前挑战与未来方向
5.1 主要挑战
| 挑战类别 | 具体表现 | 解决思路 |
|---|---|---|
| 低资源环境推理 | 田间设备算力弱、网络差 | 模型轻量化(剪枝、量化、蒸馏) |
| 多尺度动态目标 | 毫米级花粉到米级冠层 | 多尺度特征融合+注意力机制 |
| 环境干扰 | 光照、阴影、遮挡、反射 | 数据增强、多模态融合(RGB+红外) |
| 小样本与泛化 | 标注昂贵,新场景难迁移 | 自监督学习、领域自适应、大模型微调 |
5.2 未来趋势
- 农业专用基础模型:利用海量遥感/田间数据预训练,提升迁移学习能力。
- 新型传感融合:量子传感、纳米成像 + 超高效注意力机制。
- 端到端全流程自动化:从播种到收获全程无人决策。
- 可解释AI:让农民理解模型判断依据,增强信任。
六、总结
过去十年,计算机视觉和深度学习已深刻改变作物生长管理方式:
- 作物识别:YOLO+注意力+多尺度融合,复杂环境下准确率超90%。
- 分级分类:双分支+多视角+生成对抗网络,误差控制在3%以内。
- 病害监测:CNN+Transformer+多模态数据,早期诊断能力显著提升。
- 杂草检测:轻量化模型+实时喷施,化学药剂减量45%。
尽管存在算力、环境适应性等挑战,但随着农业大模型和边缘AI的发展,智慧农业的全面落地指日可待。这不仅是生产效率的提升,更是全球粮食安全和可持续发展的关键保障。
参考文献:Cao, Z., Sun, S., & Bao, X. (2025). A Review of Computer Vision and Deep Learning Applications in Crop Growth Management. Applied Sciences, 15(15), 8438.
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)