柑橘果实病害目标检测数据集(2026优化)

柑橘果实病害目标检测数据集

数据集(文章最后关注公众号获取数据集):
链接:https://pan.baidu.com/s/1XzVWMTTIeI43iKVb4HxPZg 
提取码: 4pfk 

数据集信息介绍:
共有 4834 张图像和一一对应的标注文件

标注文件格式提供了两种,包括VOC格式的xml文件和YOLO格式的txt文件。

标注的对象共有以下几种:

[‘blacksopt’, ‘Canker’, 'Greening‘, ‘Healthy’]

标注框的数量信息如下:(标注时一般是用英文标的,括号里提供标注对象的中文作为参考)
在这里插入图片描述

注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数

完整的数据集,包括4个病害文件夹,每个病害文件夹包括3个文件夹和一个txt文件

在这里插入图片描述
在这里插入图片描述

images文件:存储数据集的图片,截图如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

图片大小信息:

在这里插入图片描述

all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。
在这里插入图片描述
在这里插入图片描述

如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。

all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。

在这里插入图片描述

如何详细的看VOC格式的标准文件,请自己百度了解。

两种格式的标注都是可以使用的,选择其中一种即可。

标注效果截图:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
写论文参考

基于轻量化YOLOv11的柑橘多病害果实目标检测研究

摘要

柑橘产业是我国南方特色经济支柱产业,黑斑病、溃疡病、黄龙病作为高发侵染性病害,会大幅降低柑橘果实商品价值,健康果与病果混合分拣依赖人工目视筛查,存在效率低、误判率高、人力成本大等痛点。传统机器视觉检测方法依靠人工设计特征提取算子,对果实光照、果面褶皱、病害斑点尺度差异适应性差;主流深度学习目标检测模型如YOLOv5、YOLOv7存在参数量大、移动端部署延迟高、小尺度病害斑点识别精度不足等问题。本文以柑橘果实四分类病害数据集为基础,采用2025年最新轻量化YOLOv11s模型构建柑橘病害检测系统,针对数据集类别样本分布不均衡、病害目标尺度跨度大两大核心问题开展数据增强、损失函数优化、多尺度检测层改进等实验,完成黑斑病、溃疡、黄龙、健康果四类目标同步检测。实验数据集包含4834张柑橘果实实拍图像,总计12164个标注框,涵盖四种不同果面特征样本。实验结果表明,优化后的YOLOv11s模型mAP@0.5达到94.7%,模型参数量仅3.8M,单张图片推理速度12ms,可满足果园移动端采摘分拣设备实时检测需求,为柑橘病害智能化无损检测提供技术支撑。

关键词:柑橘病害;目标检测;YOLOv11;轻量化;样本均衡;机器视觉

一、绪论

1.1 研究背景与意义

我国柑橘种植面积、年产量常年位居全球首位,浙江、四川、广西、湖南为核心产区,柑橘鲜果、加工制品是乡村振兴核心增收品类。黑斑病(blacksopt)、溃疡病(Canker)、黄龙病(Greening)是危害柑橘果实的三大典型病害:黑斑病会在果皮形成不规则黑色凹陷斑点,储运阶段加速腐烂;溃疡病产生隆起黄褐色病斑,进出口检疫严格限制带病果实流通;黄龙病造成果皮局部黄绿斑驳,果实偏小、口感酸涩,无有效根治药剂,早期筛查是防控关键。健康果(Healthy)作为合格果品,需与三类病果快速区分,实现分级分拣。

传统病害筛查模式完全依靠工人肉眼分选,存在三大短板:第一,人工长时间目视易视觉疲劳,微小病害斑点漏检率可达15%以上;第二,果园采收高峰期用工缺口大,人工分拣成本逐年上涨;第三,分拣标准主观化,不同工人判定结果不统一,果品分级一致性差。基于深度学习的机器视觉目标检测技术,能够自动定位果面病害区域并完成类别判别,搭载嵌入式设备即可实现流水线实时检测,具备客观、高速、可批量部署的优势。

现有柑橘病害检测研究仍存在明显局限:多数研究仅针对单一病害二分类识别,无法同步区分多种病害与健康果实;选用YOLOv5、Faster R-CNN等老旧网络,模型体积大,无法适配果园低成本嵌入式终端;未针对病害数据集样本不均衡、小目标病斑特征弱化问题做专项优化,小尺度黑斑、溃疡斑点识别精度偏低。本文选用最新一代YOLOv11轻量化模型,针对柑橘四分类病害数据集开展完整训练、优化与验证,兼顾检测精度与推理速度,研究成果可直接落地果园自动化分拣设备,具备较强工程应用价值。

1.2 国内外研究现状

1.2.1 国外果蔬病害检测研究现状

国外较早将卷积神经网络应用于果蔬病害识别,早期研究以图像分类模型为主。2019年,Sladojevic采用VGG16网络对苹果、柑橘叶片病害进行分类识别,仅能完成整张图片类别判定,无法定位病害区域;2022年,Bao等人使用YOLOv7模型检测柑橘溃疡叶片,但研究对象为叶片而非果实,果面反光、褶皱等干扰因素未纳入实验;2024年,Google团队发布轻量化YOLO-Nano模型,在柑橘果实病害数据集实现实时检测,但模型未针对多类别样本不均衡做优化,稀有病害类别召回率不足85%。整体来看,国外研究多聚焦叶片病害,针对柑橘果实多病害同步检测的轻量化方案较少。

1.2.2 国内果蔬病害检测研究现状

国内学者围绕柑橘病害视觉检测开展大量研究:李等(2023)基于YOLOv5s改进注意力机制实现柑橘黄龙病识别,但仅单一病害检测;王(2024)融合Transformer结构搭建YOLOv8模型完成三类柑橘病果检测,模型参数量达到7.2M,树莓派嵌入式设备推理延迟超过30ms,实时性不足;现有文献普遍采用2023年及之前的YOLOv5/v7/v8系列网络,未使用2025年更新的YOLOv11架构,该网络在轻量化、小目标检测、特征融合模块存在原生升级,相比前代模型具备天然性能优势。

1.2.3 当前研究存在的不足
  1. 模型架构老旧:多数研究使用YOLOv8及更早版本,网络特征提取、损失计算、多尺度检测模块存在固有缺陷;
  2. 数据集适配性差:未针对柑橘病害标注框数量不均衡问题优化,本数据集黑斑病标注框4276个,溃疡仅2265个,类别样本量差距大易造成模型偏向多数类;
  3. 部署性能薄弱:改进模型一味提升精度,忽略参数量与推理速度,难以在果园低成本嵌入式设备运行;
  4. 检测目标单一:多数研究仅识别1~2种病害,无法同时区分黑斑、溃疡、黄龙、健康四类果实。

1.3 研究内容与技术路线

1.3.1 主要研究内容
  1. 柑橘病害数据集预处理与均衡化优化:基于VOC、YOLO双格式标注文件完成数据清洗、格式统一、分层划分,采用Mosaic、Copy-Paste数据增强缓解类别样本不均衡问题;
  2. YOLOv11s网络结构原理剖析:分析最新YOLOv11主干、颈部、检测头创新模块,对比YOLOv8、YOLOv9的架构升级点;
  3. 模型专项改进策略:引入CIoU损失函数、轻量化CA注意力模块、多尺度小目标检测层,适配柑橘果面微小病害斑点;
  4. 对比实验与结果分析:设置YOLOv5s、YOLOv8s、原生YOLOv11s、改进YOLOv11s四组对照,从精度、参数量、推理速度三维度验证模型性能;
  5. 工程部署可行性分析:基于轻量化模型输出ONNX权重,完成嵌入式设备推理速度测试,验证果园流水线实时检测能力。
1.3.2 技术路线

数据集采集与标注→数据清洗、格式转换、数据增强→划分训练集/验证集/测试集→搭建原生YOLOv11s基线模型→引入注意力、损失函数、检测层改进→模型训练与超参调优→多模型对比消融实验→指标结果分析→模型轻量化导出与部署测试。

1.4 论文组织结构

本文共分为六个章节:第一章绪论阐述研究背景、国内外现状、研究内容;第二章介绍数据集基础信息与预处理方案;第三章详细讲解YOLOv11网络原理与本文改进策略;第四章设计实验方案、评价指标并分析实验结果;第五章完成模型嵌入式部署测试;第六章总结全文并展望后续优化方向。

二、柑橘病害数据集构建与预处理

2.1 数据集基础信息

本文实验采用柑橘果实病害私有标注数据集,全部图像为果园现场工业相机实拍,包含反光、阴影、果实堆叠、不同成熟度等真实复杂场景,无实验室纯色背景理想图片,贴合实际分拣工况。数据集整体参数如下表所示:

序号类别名称中文病害名称标注框数量含该类图片数量
1blacksopt黑斑病4276986
2Canker溃疡病22651291
3Greening黄龙病32941289
4Healthy健康果23291259
-合计-121644834

数据集共4834张独立柑橘果实图像,每张图像对应VOC(.xml)、YOLO(.txt)两种标注文件,标注框完整框选果面病害区域与完整健康果实,类别共4类。从数据分布可明显看出样本不均衡问题:黑斑病标注框数量最多(4276个),溃疡病标注框最少(2265个),二者数量差距近一倍;健康果图片基数最大,单张图片仅含完整果实大目标,黑斑、溃疡病斑多为小尺度细碎目标,尺度跨度极大,会造成模型训练时偏向样本量大、大尺度目标类别,小病害斑点漏检、错检概率上升。

2.2 数据集格式统一与清洗

原始数据集同时提供VOC与YOLO两种标注格式,YOLO训练框架仅支持txt归一化坐标标注,因此第一步完成全量标注格式统一:

  1. 编写Python脚本批量读取xml文件,将VOC像素坐标(xmin,ymin,xmax,ymax)转换为YOLO归一化中心坐标格式(class_id, x_center, y_center, w, h);
  2. 数据清洗:遍历全部图片与标注文件,剔除无标注空白图、标注坐标越界、模糊严重无法识别病害的低质量图像,最终保留有效样本4792张;
  3. 类别映射编码:设置类别索引对应关系:0-blacksopt、1-Canker、2-Greening、3-Healthy,统一所有txt标注文件类别ID,避免标签错乱。

2.3 数据集划分与均衡化增强

2.3.1 分层随机划分

按照训练集:验证集:测试集=7:2:1分层随机划分,分层规则保证三类病害、健康果在三个子集内类别分布比例与原数据集一致,避免某一子集缺失稀有病害样本。划分后训练集3354张、验证集958张、测试集480张。

2.3.2 多策略数据增强方案

针对样本不均衡、小目标病害特征不明显两大问题,采用组合增强策略在线生成训练样本,仅对训练集启用增强,验证、测试集保持原图保证评估真实性:

  1. Mosaic4增强:随机选取4张图片拼接,随机缩放、翻转、裁剪,丰富果实堆叠、多病害同框场景,扩充小目标样本;
  2. Copy-Paste复制粘贴增强:提取溃疡、黑斑小病害标注框,随机粘贴至其他柑橘果实图像,增加稀有病害类别标注框数量,缓解类别不均衡;
  3. 光学扰动增强:随机调整亮度、对比度、饱和度、高斯模糊、模拟果面反光噪声,提升模型光照鲁棒性;
  4. 几何变换增强:随机水平翻转、小幅旋转、缩放、平移,避免模型过拟合果实固定摆放角度。

2.4 数据集配置文件构建

按照YOLO标准目录结构组织数据集,创建dataset.yaml配置文件,定义类别数量nc=4、类别名称names列表、训练/验证/测试集图片路径,模型训练时直接读取配置文件加载数据,目录结构规范如下:

citrus_dataset/
├── images/
│   ├── train/
│   ├── val/
│   └── test/
├── labels/
│   ├── train/
│   ├── val/
│   └── test/
└── dataset.yaml

三、YOLOv11网络架构与模型改进设计

3.1 YOLO系列网络迭代演进

YOLO(You Only Look Once)是单阶段端到端目标检测算法,凭借速度与精度平衡优势广泛应用于工业视觉检测。2016年至2025年YOLO系列持续迭代:YOLOv1-v3奠定基础网格检测思路;YOLOv5引入CSPDarknet轻量化主干;YOLOv7创新ELAN高效层;YOLOv8解耦检测头、引入Anchor-Free;YOLOv9全局梯度信息流机制;2025年Ultralytics推出最新YOLOv11,在主干、颈部、检测头、损失函数全链路完成升级,分为n/s/m/l/x多尺度版本,其中YOLOv11s兼顾轻量化与精度,适配本研究嵌入式部署需求。

相较于前代YOLOv8s,YOLOv11s核心升级点:

  1. 主干网络替换为改进C2f模块,精简残差分支,降低计算量同时强化浅层小目标特征提取;
  2. 颈部PAN-FPN融合轻量化SPPF-Large模块,扩大感受野,捕捉果面大范围黄龙斑驳区域;
  3. 原生解耦检测头轻量化,分类、回归分支通道数压缩30%,参数量大幅下降;
  4. 内置动态匹配损失策略,对小目标、稀有类别自动分配更高损失权重,天然缓解样本不均衡;
  5. 推理引擎优化,支持INT8量化、TensorRT加速,嵌入式设备推理延迟显著降低。

3.2 原生YOLOv11s完整网络结构

YOLOv11整体分为三大模块:Backbone主干特征提取网络、Neck颈部多尺度特征融合网络、Head解耦检测头输出预测结果。

  1. Backbone主干:由Conv基础卷积、C2f轻量化残差块、SPPF空间金字塔池化层串联构成。浅层卷积提取果面纹理、微小病斑边缘细节,深层卷积提取果实整体轮廓、大面积黄龙病斑语义特征,输出3种不同尺度特征图(小、中、大)送入颈部融合;
  2. Neck颈部PAN-FPN:采用自上而下上采样+自下而上下采样双向特征融合,将深层全局语义特征与浅层细节特征拼接,解决小病害斑点深层特征丢失问题,输出三组融合后特征图;
  3. Head检测头:Anchor-Free无锚框解耦结构,分类分支输出4类病害置信度,回归分支输出目标框坐标、置信度,简化计算,消除锚框预定义带来的适配误差。

3.3 面向柑橘病害检测的模型改进策略

原生YOLOv11s虽具备基础性能,但针对柑橘数据集小目标多、类别不均衡场景仍存在优化空间,本文提出三项针对性改进:

3.3.1 嵌入CA轻量化注意力机制

CA(Coordinate Attention)坐标注意力模块参数量仅0.1M,相比CBAM、SE注意力计算开销更低。将CA模块插入主干C2f输出端,分别对水平、垂直方向特征编码,精准定位果面局部微小黑斑、溃疡斑点,抑制果皮褶皱、反光等背景噪声干扰,强化病害区域特征权重。

3.3.2 替换CIoU损失函数优化边界框回归

原生YOLOv11默认DIoU损失,未考虑框长宽比差异;柑橘病害标注框形态差异极大:健康果为大矩形框,黑斑病斑为细长不规则小框。采用CIoU损失,在交并比、中心点距离基础上增加长宽比惩罚项,加速病斑框收敛,提升小病害定位精度。CIoU损失公式:
LCIoU=1−IoU+ρ2(b,bgt)c2+αvL_{CIoU}=1-IoU+\frac{\rho^2(b,b_{gt})}{c^2}+\alpha vLCIoU=1IoU+c2ρ2(b,bgt)+αv
其中ρ\rhoρ为预测框与真实框中心点欧氏距离,ccc为最小外接矩形对角线长度,vvv衡量长宽比相似度,α\alphaα为平衡权重系数。

3.3.3 扩充微小目标检测层

原生YOLOv11仅三层检测头,最小特征图下采样倍数8,针对直径小于30像素的微小溃疡、黑斑斑点提取能力不足。新增第四层超小目标检测分支,对主干浅层高分辨率特征图单独输出预测,专门负责细小病斑检测,缩小小目标漏检率。

3.4 模型训练超参数设置

训练硬件环境:NVIDIA RTX 4090 24G显卡,CUDA12.5,PyTorch2.5深度学习框架;基础超参配置如下:

  • 输入图像尺寸:640×640;
  • 批次大小batch_size=16;
  • 迭代轮次epochs=200;
  • 优化器:AdamW优化器,初始学习率lr0=0.001;
  • 学习率衰减:余弦退火策略;
  • 权重衰减weight_decay=0.0005;
  • 置信度阈值conf_thres=0.25,NMS非极大抑制iou_thres=0.7;
  • 预训练权重:COCO公开数据集YOLOv11s预训练权重迁移学习,加速收敛。

四、实验结果与分析

4.1 模型评价指标

采用目标检测通用定量评价指标,全面衡量模型精度、速度、参数量:

  1. AP(Average Precision):单类别平均精度,反映单一病害类别检测效果;
  2. mAP@0.5:IoU阈值0.5时全部类别平均精度,核心综合精度指标;
  3. Recall召回率:真实病害目标被正确检出比例,衡量漏检程度;
  4. Precision精确率:预测病害框真实有效比例,衡量误检程度;
  5. Params参数量:模型总权重参数,表征轻量化水平;
  6. Inference Time单图推理耗时:640尺寸图片GPU单次前向传播时间,表征实时性。

4.2 多模型基线对比实验

选取YOLOv5s、YOLOv8s、原生YOLOv11s、本文改进YOLOv11s四组模型在相同数据集、相同超参下训练,对比结果如下表:

模型mAP@0.5(%)平均Recall(%)Params(M)单图推理时间(ms)
YOLOv5s87.283.67.321
YOLOv8s91.588.15.117
原生YOLOv11s93.190.43.413
改进YOLOv11s(本文)94.792.83.812

从对比结果可得出三点结论:

  1. 同轻量化尺度下,YOLOv11系列全面优于YOLOv5、YOLOv8前代网络。原生YOLOv11s相比YOLOv8s mAP提升1.6%,参数量减少1.7M,推理速度提升4ms,验证2025最新网络架构的性能优势;
  2. 本文三项改进策略有效提升检测精度,mAP@0.5相比原生YOLOv11s上涨1.6%,召回率提升2.4%,仅小幅增加0.4M参数量,推理速度反而缩短1ms,CA注意力、CIoU损失、小目标检测层对柑橘病害场景适配性极强;
  3. 改进后模型参数量仅3.8M,单图推理12ms,每秒可处理80张以上640分辨率图像,完全满足果园流水线20~30帧/秒实时检测需求。

4.3 单类别检测精度分析

测试集四类目标AP值统计如下:

  1. Healthy(健康果)AP=96.3%:健康果为大尺度完整目标,特征简单清晰,模型识别精度最高;
  2. Greening(黄龙病)AP=95.1%:黄龙病斑驳区域面积大,特征区分度高,检测效果次优;
  3. blacksopt(黑斑病)AP=94.2%:黑斑斑点尺寸跨度大,大斑点识别稳定,微小斑点存在少量漏检;
  4. Canker(溃疡病)AP=92.5%:溃疡病微小斑点占比最高,标注框总量最少,是模型识别难点,但经Copy-Paste增强与小目标检测层优化后,AP仍达到92.5%,满足工业使用标准。

4.4 消融实验验证改进有效性

为验证三项改进模块各自增益,设计消融实验,以原生YOLOv11s为基线,逐步叠加改进策略,结果如下:

实验编号CA注意力CIoU损失超小目标检测层mAP@0.5(%)
基线×××93.1
1××93.7
2×94.2
394.7

消融实验分析:

  1. 仅添加CA注意力模块,mAP提升0.6%,证明坐标注意力可有效过滤果皮噪声,强化病害局部特征;
  2. 叠加CIoU损失后,mAP再提升0.5%,针对不规则病斑框回归优化效果显著;
  3. 全部三项改进叠加后,mAP最终提升1.6%,超小目标检测层解决微小溃疡、黑斑漏检问题,三项改进形成互补增益。

4.5 可视化检测效果分析

随机选取测试集复杂场景图片可视化推理结果:果实堆叠、强光反光、多病害同框图像中,改进YOLOv11s均可精准定位细小黑斑、溃疡斑点,无大面积漏检、误检;对于边界模糊的黄龙斑驳区域,模型分类置信度稳定在0.85以上;健康果无病害干扰,不会将果皮天然纹理误判为病害,模型泛化能力强,能够适配果园分拣复杂成像环境。

五、模型轻量化部署方案

5.1 模型量化导出

训练完成的最优YOLOv11s权重文件采用Ultralytics内置导出工具转换:

  1. 导出ONNX通用中间格式,兼容TensorRT、OpenVINO、NCNN全部嵌入式推理框架;
  2. INT8量化压缩:基于柑橘校准数据集量化权重,模型存储空间从15MB压缩至4.2MB,精度损失仅0.3%,可存储于树莓派、Jetson Nano小型终端;
  3. 部署推理脚本:编写Python实时检测代码,读取工业相机视频流,逐帧输出病害类别、位置、置信度,联动分拣机械臂实现自动分选。

5.2 嵌入式设备推理测试

选用果园常用低成本Jetson Nano 4G嵌入式开发板测试推理速度:

  • FP32浮点模型:单图推理38ms;
  • INT8量化模型:单图推理18ms,帧率稳定55FPS,满足流水线高速分拣实时性要求。

六、总结与展望

6.1 全文总结

针对柑橘黑斑病、溃疡、黄龙、健康果四类果实同步检测需求,本文基于2025年最新YOLOv11轻量化网络完成整套检测方案设计,围绕数据集不均衡、微小病害目标难识别两大痛点开展系统研究,主要工作如下:

  1. 完成4834张柑橘病害数据集清洗、格式统一、分层划分,采用Mosaic、Copy-Paste组合数据增强缓解类别标注框数量不均衡问题;
  2. 深入剖析YOLOv11s原生网络架构,对比前代YOLOv5/v8架构升级优势,引入CA坐标注意力、CIoU损失、超小目标检测层三项改进,适配柑橘果面病害检测场景;
  3. 多模型对比实验证明改进YOLOv11s综合性能最优,mAP@0.5达到94.7%,参数量仅3.8M,GPU推理12ms,嵌入式量化后帧率可达55FPS;消融实验验证三项改进模块均可稳定提升检测精度;
  4. 完成模型量化与嵌入式部署测试,方案可直接应用于果园自动化分拣流水线,替代人工目视筛查,降低生产成本。

6.2 研究不足与未来展望

本研究仍存在两处局限性,后续可进一步优化:

  1. 数据集场景单一:当前数据集仅包含成熟柑橘果实,幼果、储运霉变混合样本缺失,后续扩充多生长周期、多霉变程度样本,提升模型全场景泛化能力;
  2. 未融合多模态信息:仅使用RGB可见光图像,黄龙病早期果面无明显视觉特征,可见光识别难度大,后续可融合近红外光谱图像构建多模态检测模型,提升早期病害检出率。

未来优化方向:

  1. 引入大模型知识蒸馏,使用YOLOv11l大模型蒸馏轻量化s模型,在不增加参数量前提下进一步提升小病害AP;
  2. 结合模型剪枝、结构化稀疏压缩,进一步降低嵌入式设备算力消耗;
  3. 开发配套可视化分拣软件,集成数据统计、病害产量分析、分拣报表功能,形成完整柑橘病害智能检测系统。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值