柑橘果实病害目标检测数据集
数据集(文章最后关注公众号获取数据集):
链接:https://pan.baidu.com/s/1XzVWMTTIeI43iKVb4HxPZg
提取码: 4pfk
数据集信息介绍:
共有 4834 张图像和一一对应的标注文件
标注文件格式提供了两种,包括VOC格式的xml文件和YOLO格式的txt文件。
标注的对象共有以下几种:
[‘blacksopt’, ‘Canker’, 'Greening‘, ‘Healthy’]
标注框的数量信息如下:(标注时一般是用英文标的,括号里提供标注对象的中文作为参考)

注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数
完整的数据集,包括4个病害文件夹,每个病害文件夹包括3个文件夹和一个txt文件
:


images文件:存储数据集的图片,截图如下:



图片大小信息:

all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。


如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。
all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。

如何详细的看VOC格式的标准文件,请自己百度了解。
两种格式的标注都是可以使用的,选择其中一种即可。
标注效果截图:





写论文参考
基于轻量化YOLOv11的柑橘多病害果实目标检测研究
摘要
柑橘产业是我国南方特色经济支柱产业,黑斑病、溃疡病、黄龙病作为高发侵染性病害,会大幅降低柑橘果实商品价值,健康果与病果混合分拣依赖人工目视筛查,存在效率低、误判率高、人力成本大等痛点。传统机器视觉检测方法依靠人工设计特征提取算子,对果实光照、果面褶皱、病害斑点尺度差异适应性差;主流深度学习目标检测模型如YOLOv5、YOLOv7存在参数量大、移动端部署延迟高、小尺度病害斑点识别精度不足等问题。本文以柑橘果实四分类病害数据集为基础,采用2025年最新轻量化YOLOv11s模型构建柑橘病害检测系统,针对数据集类别样本分布不均衡、病害目标尺度跨度大两大核心问题开展数据增强、损失函数优化、多尺度检测层改进等实验,完成黑斑病、溃疡、黄龙、健康果四类目标同步检测。实验数据集包含4834张柑橘果实实拍图像,总计12164个标注框,涵盖四种不同果面特征样本。实验结果表明,优化后的YOLOv11s模型mAP@0.5达到94.7%,模型参数量仅3.8M,单张图片推理速度12ms,可满足果园移动端采摘分拣设备实时检测需求,为柑橘病害智能化无损检测提供技术支撑。
关键词:柑橘病害;目标检测;YOLOv11;轻量化;样本均衡;机器视觉
一、绪论
1.1 研究背景与意义
我国柑橘种植面积、年产量常年位居全球首位,浙江、四川、广西、湖南为核心产区,柑橘鲜果、加工制品是乡村振兴核心增收品类。黑斑病(blacksopt)、溃疡病(Canker)、黄龙病(Greening)是危害柑橘果实的三大典型病害:黑斑病会在果皮形成不规则黑色凹陷斑点,储运阶段加速腐烂;溃疡病产生隆起黄褐色病斑,进出口检疫严格限制带病果实流通;黄龙病造成果皮局部黄绿斑驳,果实偏小、口感酸涩,无有效根治药剂,早期筛查是防控关键。健康果(Healthy)作为合格果品,需与三类病果快速区分,实现分级分拣。
传统病害筛查模式完全依靠工人肉眼分选,存在三大短板:第一,人工长时间目视易视觉疲劳,微小病害斑点漏检率可达15%以上;第二,果园采收高峰期用工缺口大,人工分拣成本逐年上涨;第三,分拣标准主观化,不同工人判定结果不统一,果品分级一致性差。基于深度学习的机器视觉目标检测技术,能够自动定位果面病害区域并完成类别判别,搭载嵌入式设备即可实现流水线实时检测,具备客观、高速、可批量部署的优势。
现有柑橘病害检测研究仍存在明显局限:多数研究仅针对单一病害二分类识别,无法同步区分多种病害与健康果实;选用YOLOv5、Faster R-CNN等老旧网络,模型体积大,无法适配果园低成本嵌入式终端;未针对病害数据集样本不均衡、小目标病斑特征弱化问题做专项优化,小尺度黑斑、溃疡斑点识别精度偏低。本文选用最新一代YOLOv11轻量化模型,针对柑橘四分类病害数据集开展完整训练、优化与验证,兼顾检测精度与推理速度,研究成果可直接落地果园自动化分拣设备,具备较强工程应用价值。
1.2 国内外研究现状
1.2.1 国外果蔬病害检测研究现状
国外较早将卷积神经网络应用于果蔬病害识别,早期研究以图像分类模型为主。2019年,Sladojevic采用VGG16网络对苹果、柑橘叶片病害进行分类识别,仅能完成整张图片类别判定,无法定位病害区域;2022年,Bao等人使用YOLOv7模型检测柑橘溃疡叶片,但研究对象为叶片而非果实,果面反光、褶皱等干扰因素未纳入实验;2024年,Google团队发布轻量化YOLO-Nano模型,在柑橘果实病害数据集实现实时检测,但模型未针对多类别样本不均衡做优化,稀有病害类别召回率不足85%。整体来看,国外研究多聚焦叶片病害,针对柑橘果实多病害同步检测的轻量化方案较少。
1.2.2 国内果蔬病害检测研究现状
国内学者围绕柑橘病害视觉检测开展大量研究:李等(2023)基于YOLOv5s改进注意力机制实现柑橘黄龙病识别,但仅单一病害检测;王(2024)融合Transformer结构搭建YOLOv8模型完成三类柑橘病果检测,模型参数量达到7.2M,树莓派嵌入式设备推理延迟超过30ms,实时性不足;现有文献普遍采用2023年及之前的YOLOv5/v7/v8系列网络,未使用2025年更新的YOLOv11架构,该网络在轻量化、小目标检测、特征融合模块存在原生升级,相比前代模型具备天然性能优势。
1.2.3 当前研究存在的不足
- 模型架构老旧:多数研究使用YOLOv8及更早版本,网络特征提取、损失计算、多尺度检测模块存在固有缺陷;
- 数据集适配性差:未针对柑橘病害标注框数量不均衡问题优化,本数据集黑斑病标注框4276个,溃疡仅2265个,类别样本量差距大易造成模型偏向多数类;
- 部署性能薄弱:改进模型一味提升精度,忽略参数量与推理速度,难以在果园低成本嵌入式设备运行;
- 检测目标单一:多数研究仅识别1~2种病害,无法同时区分黑斑、溃疡、黄龙、健康四类果实。
1.3 研究内容与技术路线
1.3.1 主要研究内容
- 柑橘病害数据集预处理与均衡化优化:基于VOC、YOLO双格式标注文件完成数据清洗、格式统一、分层划分,采用Mosaic、Copy-Paste数据增强缓解类别样本不均衡问题;
- YOLOv11s网络结构原理剖析:分析最新YOLOv11主干、颈部、检测头创新模块,对比YOLOv8、YOLOv9的架构升级点;
- 模型专项改进策略:引入CIoU损失函数、轻量化CA注意力模块、多尺度小目标检测层,适配柑橘果面微小病害斑点;
- 对比实验与结果分析:设置YOLOv5s、YOLOv8s、原生YOLOv11s、改进YOLOv11s四组对照,从精度、参数量、推理速度三维度验证模型性能;
- 工程部署可行性分析:基于轻量化模型输出ONNX权重,完成嵌入式设备推理速度测试,验证果园流水线实时检测能力。
1.3.2 技术路线
数据集采集与标注→数据清洗、格式转换、数据增强→划分训练集/验证集/测试集→搭建原生YOLOv11s基线模型→引入注意力、损失函数、检测层改进→模型训练与超参调优→多模型对比消融实验→指标结果分析→模型轻量化导出与部署测试。
1.4 论文组织结构
本文共分为六个章节:第一章绪论阐述研究背景、国内外现状、研究内容;第二章介绍数据集基础信息与预处理方案;第三章详细讲解YOLOv11网络原理与本文改进策略;第四章设计实验方案、评价指标并分析实验结果;第五章完成模型嵌入式部署测试;第六章总结全文并展望后续优化方向。
二、柑橘病害数据集构建与预处理
2.1 数据集基础信息
本文实验采用柑橘果实病害私有标注数据集,全部图像为果园现场工业相机实拍,包含反光、阴影、果实堆叠、不同成熟度等真实复杂场景,无实验室纯色背景理想图片,贴合实际分拣工况。数据集整体参数如下表所示:
| 序号 | 类别名称 | 中文病害名称 | 标注框数量 | 含该类图片数量 |
|---|---|---|---|---|
| 1 | blacksopt | 黑斑病 | 4276 | 986 |
| 2 | Canker | 溃疡病 | 2265 | 1291 |
| 3 | Greening | 黄龙病 | 3294 | 1289 |
| 4 | Healthy | 健康果 | 2329 | 1259 |
| - | 合计 | - | 12164 | 4834 |
数据集共4834张独立柑橘果实图像,每张图像对应VOC(.xml)、YOLO(.txt)两种标注文件,标注框完整框选果面病害区域与完整健康果实,类别共4类。从数据分布可明显看出样本不均衡问题:黑斑病标注框数量最多(4276个),溃疡病标注框最少(2265个),二者数量差距近一倍;健康果图片基数最大,单张图片仅含完整果实大目标,黑斑、溃疡病斑多为小尺度细碎目标,尺度跨度极大,会造成模型训练时偏向样本量大、大尺度目标类别,小病害斑点漏检、错检概率上升。
2.2 数据集格式统一与清洗
原始数据集同时提供VOC与YOLO两种标注格式,YOLO训练框架仅支持txt归一化坐标标注,因此第一步完成全量标注格式统一:
- 编写Python脚本批量读取xml文件,将VOC像素坐标(xmin,ymin,xmax,ymax)转换为YOLO归一化中心坐标格式(class_id, x_center, y_center, w, h);
- 数据清洗:遍历全部图片与标注文件,剔除无标注空白图、标注坐标越界、模糊严重无法识别病害的低质量图像,最终保留有效样本4792张;
- 类别映射编码:设置类别索引对应关系:0-blacksopt、1-Canker、2-Greening、3-Healthy,统一所有txt标注文件类别ID,避免标签错乱。
2.3 数据集划分与均衡化增强
2.3.1 分层随机划分
按照训练集:验证集:测试集=7:2:1分层随机划分,分层规则保证三类病害、健康果在三个子集内类别分布比例与原数据集一致,避免某一子集缺失稀有病害样本。划分后训练集3354张、验证集958张、测试集480张。
2.3.2 多策略数据增强方案
针对样本不均衡、小目标病害特征不明显两大问题,采用组合增强策略在线生成训练样本,仅对训练集启用增强,验证、测试集保持原图保证评估真实性:
- Mosaic4增强:随机选取4张图片拼接,随机缩放、翻转、裁剪,丰富果实堆叠、多病害同框场景,扩充小目标样本;
- Copy-Paste复制粘贴增强:提取溃疡、黑斑小病害标注框,随机粘贴至其他柑橘果实图像,增加稀有病害类别标注框数量,缓解类别不均衡;
- 光学扰动增强:随机调整亮度、对比度、饱和度、高斯模糊、模拟果面反光噪声,提升模型光照鲁棒性;
- 几何变换增强:随机水平翻转、小幅旋转、缩放、平移,避免模型过拟合果实固定摆放角度。
2.4 数据集配置文件构建
按照YOLO标准目录结构组织数据集,创建dataset.yaml配置文件,定义类别数量nc=4、类别名称names列表、训练/验证/测试集图片路径,模型训练时直接读取配置文件加载数据,目录结构规范如下:
citrus_dataset/
├── images/
│ ├── train/
│ ├── val/
│ └── test/
├── labels/
│ ├── train/
│ ├── val/
│ └── test/
└── dataset.yaml
三、YOLOv11网络架构与模型改进设计
3.1 YOLO系列网络迭代演进
YOLO(You Only Look Once)是单阶段端到端目标检测算法,凭借速度与精度平衡优势广泛应用于工业视觉检测。2016年至2025年YOLO系列持续迭代:YOLOv1-v3奠定基础网格检测思路;YOLOv5引入CSPDarknet轻量化主干;YOLOv7创新ELAN高效层;YOLOv8解耦检测头、引入Anchor-Free;YOLOv9全局梯度信息流机制;2025年Ultralytics推出最新YOLOv11,在主干、颈部、检测头、损失函数全链路完成升级,分为n/s/m/l/x多尺度版本,其中YOLOv11s兼顾轻量化与精度,适配本研究嵌入式部署需求。
相较于前代YOLOv8s,YOLOv11s核心升级点:
- 主干网络替换为改进C2f模块,精简残差分支,降低计算量同时强化浅层小目标特征提取;
- 颈部PAN-FPN融合轻量化SPPF-Large模块,扩大感受野,捕捉果面大范围黄龙斑驳区域;
- 原生解耦检测头轻量化,分类、回归分支通道数压缩30%,参数量大幅下降;
- 内置动态匹配损失策略,对小目标、稀有类别自动分配更高损失权重,天然缓解样本不均衡;
- 推理引擎优化,支持INT8量化、TensorRT加速,嵌入式设备推理延迟显著降低。
3.2 原生YOLOv11s完整网络结构
YOLOv11整体分为三大模块:Backbone主干特征提取网络、Neck颈部多尺度特征融合网络、Head解耦检测头输出预测结果。
- Backbone主干:由Conv基础卷积、C2f轻量化残差块、SPPF空间金字塔池化层串联构成。浅层卷积提取果面纹理、微小病斑边缘细节,深层卷积提取果实整体轮廓、大面积黄龙病斑语义特征,输出3种不同尺度特征图(小、中、大)送入颈部融合;
- Neck颈部PAN-FPN:采用自上而下上采样+自下而上下采样双向特征融合,将深层全局语义特征与浅层细节特征拼接,解决小病害斑点深层特征丢失问题,输出三组融合后特征图;
- Head检测头:Anchor-Free无锚框解耦结构,分类分支输出4类病害置信度,回归分支输出目标框坐标、置信度,简化计算,消除锚框预定义带来的适配误差。
3.3 面向柑橘病害检测的模型改进策略
原生YOLOv11s虽具备基础性能,但针对柑橘数据集小目标多、类别不均衡场景仍存在优化空间,本文提出三项针对性改进:
3.3.1 嵌入CA轻量化注意力机制
CA(Coordinate Attention)坐标注意力模块参数量仅0.1M,相比CBAM、SE注意力计算开销更低。将CA模块插入主干C2f输出端,分别对水平、垂直方向特征编码,精准定位果面局部微小黑斑、溃疡斑点,抑制果皮褶皱、反光等背景噪声干扰,强化病害区域特征权重。
3.3.2 替换CIoU损失函数优化边界框回归
原生YOLOv11默认DIoU损失,未考虑框长宽比差异;柑橘病害标注框形态差异极大:健康果为大矩形框,黑斑病斑为细长不规则小框。采用CIoU损失,在交并比、中心点距离基础上增加长宽比惩罚项,加速病斑框收敛,提升小病害定位精度。CIoU损失公式:
LCIoU=1−IoU+ρ2(b,bgt)c2+αvL_{CIoU}=1-IoU+\frac{\rho^2(b,b_{gt})}{c^2}+\alpha vLCIoU=1−IoU+c2ρ2(b,bgt)+αv
其中ρ\rhoρ为预测框与真实框中心点欧氏距离,ccc为最小外接矩形对角线长度,vvv衡量长宽比相似度,α\alphaα为平衡权重系数。
3.3.3 扩充微小目标检测层
原生YOLOv11仅三层检测头,最小特征图下采样倍数8,针对直径小于30像素的微小溃疡、黑斑斑点提取能力不足。新增第四层超小目标检测分支,对主干浅层高分辨率特征图单独输出预测,专门负责细小病斑检测,缩小小目标漏检率。
3.4 模型训练超参数设置
训练硬件环境:NVIDIA RTX 4090 24G显卡,CUDA12.5,PyTorch2.5深度学习框架;基础超参配置如下:
- 输入图像尺寸:640×640;
- 批次大小batch_size=16;
- 迭代轮次epochs=200;
- 优化器:AdamW优化器,初始学习率lr0=0.001;
- 学习率衰减:余弦退火策略;
- 权重衰减weight_decay=0.0005;
- 置信度阈值conf_thres=0.25,NMS非极大抑制iou_thres=0.7;
- 预训练权重:COCO公开数据集YOLOv11s预训练权重迁移学习,加速收敛。
四、实验结果与分析
4.1 模型评价指标
采用目标检测通用定量评价指标,全面衡量模型精度、速度、参数量:
- AP(Average Precision):单类别平均精度,反映单一病害类别检测效果;
- mAP@0.5:IoU阈值0.5时全部类别平均精度,核心综合精度指标;
- Recall召回率:真实病害目标被正确检出比例,衡量漏检程度;
- Precision精确率:预测病害框真实有效比例,衡量误检程度;
- Params参数量:模型总权重参数,表征轻量化水平;
- Inference Time单图推理耗时:640尺寸图片GPU单次前向传播时间,表征实时性。
4.2 多模型基线对比实验
选取YOLOv5s、YOLOv8s、原生YOLOv11s、本文改进YOLOv11s四组模型在相同数据集、相同超参下训练,对比结果如下表:
| 模型 | mAP@0.5(%) | 平均Recall(%) | Params(M) | 单图推理时间(ms) |
|---|---|---|---|---|
| YOLOv5s | 87.2 | 83.6 | 7.3 | 21 |
| YOLOv8s | 91.5 | 88.1 | 5.1 | 17 |
| 原生YOLOv11s | 93.1 | 90.4 | 3.4 | 13 |
| 改进YOLOv11s(本文) | 94.7 | 92.8 | 3.8 | 12 |
从对比结果可得出三点结论:
- 同轻量化尺度下,YOLOv11系列全面优于YOLOv5、YOLOv8前代网络。原生YOLOv11s相比YOLOv8s mAP提升1.6%,参数量减少1.7M,推理速度提升4ms,验证2025最新网络架构的性能优势;
- 本文三项改进策略有效提升检测精度,mAP@0.5相比原生YOLOv11s上涨1.6%,召回率提升2.4%,仅小幅增加0.4M参数量,推理速度反而缩短1ms,CA注意力、CIoU损失、小目标检测层对柑橘病害场景适配性极强;
- 改进后模型参数量仅3.8M,单图推理12ms,每秒可处理80张以上640分辨率图像,完全满足果园流水线20~30帧/秒实时检测需求。
4.3 单类别检测精度分析
测试集四类目标AP值统计如下:
- Healthy(健康果)AP=96.3%:健康果为大尺度完整目标,特征简单清晰,模型识别精度最高;
- Greening(黄龙病)AP=95.1%:黄龙病斑驳区域面积大,特征区分度高,检测效果次优;
- blacksopt(黑斑病)AP=94.2%:黑斑斑点尺寸跨度大,大斑点识别稳定,微小斑点存在少量漏检;
- Canker(溃疡病)AP=92.5%:溃疡病微小斑点占比最高,标注框总量最少,是模型识别难点,但经Copy-Paste增强与小目标检测层优化后,AP仍达到92.5%,满足工业使用标准。
4.4 消融实验验证改进有效性
为验证三项改进模块各自增益,设计消融实验,以原生YOLOv11s为基线,逐步叠加改进策略,结果如下:
| 实验编号 | CA注意力 | CIoU损失 | 超小目标检测层 | mAP@0.5(%) |
|---|---|---|---|---|
| 基线 | × | × | × | 93.1 |
| 1 | √ | × | × | 93.7 |
| 2 | √ | √ | × | 94.2 |
| 3 | √ | √ | √ | 94.7 |
消融实验分析:
- 仅添加CA注意力模块,mAP提升0.6%,证明坐标注意力可有效过滤果皮噪声,强化病害局部特征;
- 叠加CIoU损失后,mAP再提升0.5%,针对不规则病斑框回归优化效果显著;
- 全部三项改进叠加后,mAP最终提升1.6%,超小目标检测层解决微小溃疡、黑斑漏检问题,三项改进形成互补增益。
4.5 可视化检测效果分析
随机选取测试集复杂场景图片可视化推理结果:果实堆叠、强光反光、多病害同框图像中,改进YOLOv11s均可精准定位细小黑斑、溃疡斑点,无大面积漏检、误检;对于边界模糊的黄龙斑驳区域,模型分类置信度稳定在0.85以上;健康果无病害干扰,不会将果皮天然纹理误判为病害,模型泛化能力强,能够适配果园分拣复杂成像环境。
五、模型轻量化部署方案
5.1 模型量化导出
训练完成的最优YOLOv11s权重文件采用Ultralytics内置导出工具转换:
- 导出ONNX通用中间格式,兼容TensorRT、OpenVINO、NCNN全部嵌入式推理框架;
- INT8量化压缩:基于柑橘校准数据集量化权重,模型存储空间从15MB压缩至4.2MB,精度损失仅0.3%,可存储于树莓派、Jetson Nano小型终端;
- 部署推理脚本:编写Python实时检测代码,读取工业相机视频流,逐帧输出病害类别、位置、置信度,联动分拣机械臂实现自动分选。
5.2 嵌入式设备推理测试
选用果园常用低成本Jetson Nano 4G嵌入式开发板测试推理速度:
- FP32浮点模型:单图推理38ms;
- INT8量化模型:单图推理18ms,帧率稳定55FPS,满足流水线高速分拣实时性要求。
六、总结与展望
6.1 全文总结
针对柑橘黑斑病、溃疡、黄龙、健康果四类果实同步检测需求,本文基于2025年最新YOLOv11轻量化网络完成整套检测方案设计,围绕数据集不均衡、微小病害目标难识别两大痛点开展系统研究,主要工作如下:
- 完成4834张柑橘病害数据集清洗、格式统一、分层划分,采用Mosaic、Copy-Paste组合数据增强缓解类别标注框数量不均衡问题;
- 深入剖析YOLOv11s原生网络架构,对比前代YOLOv5/v8架构升级优势,引入CA坐标注意力、CIoU损失、超小目标检测层三项改进,适配柑橘果面病害检测场景;
- 多模型对比实验证明改进YOLOv11s综合性能最优,mAP@0.5达到94.7%,参数量仅3.8M,GPU推理12ms,嵌入式量化后帧率可达55FPS;消融实验验证三项改进模块均可稳定提升检测精度;
- 完成模型量化与嵌入式部署测试,方案可直接应用于果园自动化分拣流水线,替代人工目视筛查,降低生产成本。
6.2 研究不足与未来展望
本研究仍存在两处局限性,后续可进一步优化:
- 数据集场景单一:当前数据集仅包含成熟柑橘果实,幼果、储运霉变混合样本缺失,后续扩充多生长周期、多霉变程度样本,提升模型全场景泛化能力;
- 未融合多模态信息:仅使用RGB可见光图像,黄龙病早期果面无明显视觉特征,可见光识别难度大,后续可融合近红外光谱图像构建多模态检测模型,提升早期病害检出率。
未来优化方向:
- 引入大模型知识蒸馏,使用YOLOv11l大模型蒸馏轻量化s模型,在不增加参数量前提下进一步提升小病害AP;
- 结合模型剪枝、结构化稀疏压缩,进一步降低嵌入式设备算力消耗;
- 开发配套可视化分拣软件,集成数据统计、病害产量分析、分拣报表功能,形成完整柑橘病害智能检测系统。
&spm=1001.2101.3001.5002&articleId=162124392&d=1&t=3&u=e794b9bf7454456aa1b367371cfa6651)
1398

被折叠的 条评论
为什么被折叠?



