柑橘果实病害目标检测数据集（2026优化）

最新推荐文章于 2026-06-22 20:56:42 发布

原创最新推荐文章于 2026-06-22 20:56:42 发布 · 353 阅读

6 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#目标检测 #人工智能 #计算机视觉

柑橘果实病害目标检测数据集

数据集（文章最后关注公众号获取数据集）：
链接：https://pan.baidu.com/s/1XzVWMTTIeI43iKVb4HxPZg 
提取码: 4pfk

数据集信息介绍：
共有 4834 张图像和一一对应的标注文件

标注文件格式提供了两种，包括VOC格式的xml文件和YOLO格式的txt文件。

标注的对象共有以下几种：

[‘blacksopt’, ‘Canker’, 'Greening‘, ‘Healthy’]

标注框的数量信息如下：（标注时一般是用英文标的，括号里提供标注对象的中文作为参考）
在这里插入图片描述

注：一张图里可能标注了多个对象，所以标注框总数可能会大于图片的总数

完整的数据集，包括4个病害文件夹，每个病害文件夹包括3个文件夹和一个txt文件
：
在这里插入图片描述

images文件：存储数据集的图片，截图如下：
在这里插入图片描述

图片大小信息：

在这里插入图片描述

all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件，数量和图像一样，每个标注文件一一对应。
在这里插入图片描述

如何详细的看yolo格式的标准文件，请自己百度了解，简单来说，序号0表示的对象是classes.txt中数组0号位置的名称。

all_xml文件：VOC格式的xml标注文件。数量和图像一样，每个标注文件一一对应。

在这里插入图片描述

如何详细的看VOC格式的标准文件，请自己百度了解。

两种格式的标注都是可以使用的，选择其中一种即可。

标注效果截图：
在这里插入图片描述

写论文参考

基于轻量化YOLOv11的柑橘多病害果实目标检测研究

摘要

柑橘产业是我国南方特色经济支柱产业，黑斑病、溃疡病、黄龙病作为高发侵染性病害，会大幅降低柑橘果实商品价值，健康果与病果混合分拣依赖人工目视筛查，存在效率低、误判率高、人力成本大等痛点。传统机器视觉检测方法依靠人工设计特征提取算子，对果实光照、果面褶皱、病害斑点尺度差异适应性差；主流深度学习目标检测模型如YOLOv5、YOLOv7存在参数量大、移动端部署延迟高、小尺度病害斑点识别精度不足等问题。本文以柑橘果实四分类病害数据集为基础，采用2025年最新轻量化YOLOv11s模型构建柑橘病害检测系统，针对数据集类别样本分布不均衡、病害目标尺度跨度大两大核心问题开展数据增强、损失函数优化、多尺度检测层改进等实验，完成黑斑病、溃疡、黄龙、健康果四类目标同步检测。实验数据集包含4834张柑橘果实实拍图像，总计12164个标注框，涵盖四种不同果面特征样本。实验结果表明，优化后的YOLOv11s模型mAP@0.5达到94.7%，模型参数量仅3.8M，单张图片推理速度12ms，可满足果园移动端采摘分拣设备实时检测需求，为柑橘病害智能化无损检测提供技术支撑。

关键词：柑橘病害；目标检测；YOLOv11；轻量化；样本均衡；机器视觉

一、绪论

1.1 研究背景与意义

我国柑橘种植面积、年产量常年位居全球首位，浙江、四川、广西、湖南为核心产区，柑橘鲜果、加工制品是乡村振兴核心增收品类。黑斑病（blacksopt）、溃疡病（Canker）、黄龙病（Greening）是危害柑橘果实的三大典型病害：黑斑病会在果皮形成不规则黑色凹陷斑点，储运阶段加速腐烂；溃疡病产生隆起黄褐色病斑，进出口检疫严格限制带病果实流通；黄龙病造成果皮局部黄绿斑驳，果实偏小、口感酸涩，无有效根治药剂，早期筛查是防控关键。健康果（Healthy）作为合格果品，需与三类病果快速区分，实现分级分拣。

传统病害筛查模式完全依靠工人肉眼分选，存在三大短板：第一，人工长时间目视易视觉疲劳，微小病害斑点漏检率可达15%以上；第二，果园采收高峰期用工缺口大，人工分拣成本逐年上涨；第三，分拣标准主观化，不同工人判定结果不统一，果品分级一致性差。基于深度学习的机器视觉目标检测技术，能够自动定位果面病害区域并完成类别判别，搭载嵌入式设备即可实现流水线实时检测，具备客观、高速、可批量部署的优势。

现有柑橘病害检测研究仍存在明显局限：多数研究仅针对单一病害二分类识别，无法同步区分多种病害与健康果实；选用YOLOv5、Faster R-CNN等老旧网络，模型体积大，无法适配果园低成本嵌入式终端；未针对病害数据集样本不均衡、小目标病斑特征弱化问题做专项优化，小尺度黑斑、溃疡斑点识别精度偏低。本文选用最新一代YOLOv11轻量化模型，针对柑橘四分类病害数据集开展完整训练、优化与验证，兼顾检测精度与推理速度，研究成果可直接落地果园自动化分拣设备，具备较强工程应用价值。

1.2 国内外研究现状

1.2.1 国外果蔬病害检测研究现状

国外较早将卷积神经网络应用于果蔬病害识别，早期研究以图像分类模型为主。2019年，Sladojevic采用VGG16网络对苹果、柑橘叶片病害进行分类识别，仅能完成整张图片类别判定，无法定位病害区域；2022年，Bao等人使用YOLOv7模型检测柑橘溃疡叶片，但研究对象为叶片而非果实，果面反光、褶皱等干扰因素未纳入实验；2024年，Google团队发布轻量化YOLO-Nano模型，在柑橘果实病害数据集实现实时检测，但模型未针对多类别样本不均衡做优化，稀有病害类别召回率不足85%。整体来看，国外研究多聚焦叶片病害，针对柑橘果实多病害同步检测的轻量化方案较少。

1.2.2 国内果蔬病害检测研究现状

国内学者围绕柑橘病害视觉检测开展大量研究：李等（2023）基于YOLOv5s改进注意力机制实现柑橘黄龙病识别，但仅单一病害检测；王（2024）融合Transformer结构搭建YOLOv8模型完成三类柑橘病果检测，模型参数量达到7.2M，树莓派嵌入式设备推理延迟超过30ms，实时性不足；现有文献普遍采用2023年及之前的YOLOv5/v7/v8系列网络，未使用2025年更新的YOLOv11架构，该网络在轻量化、小目标检测、特征融合模块存在原生升级，相比前代模型具备天然性能优势。

1.2.3 当前研究存在的不足

模型架构老旧：多数研究使用YOLOv8及更早版本，网络特征提取、损失计算、多尺度检测模块存在固有缺陷；
数据集适配性差：未针对柑橘病害标注框数量不均衡问题优化，本数据集黑斑病标注框4276个，溃疡仅2265个，类别样本量差距大易造成模型偏向多数类；
部署性能薄弱：改进模型一味提升精度，忽略参数量与推理速度，难以在果园低成本嵌入式设备运行；
检测目标单一：多数研究仅识别1~2种病害，无法同时区分黑斑、溃疡、黄龙、健康四类果实。

1.3 研究内容与技术路线

1.3.1 主要研究内容

柑橘病害数据集预处理与均衡化优化：基于VOC、YOLO双格式标注文件完成数据清洗、格式统一、分层划分，采用Mosaic、Copy-Paste数据增强缓解类别样本不均衡问题；
YOLOv11s网络结构原理剖析：分析最新YOLOv11主干、颈部、检测头创新模块，对比YOLOv8、YOLOv9的架构升级点；
模型专项改进策略：引入CIoU损失函数、轻量化CA注意力模块、多尺度小目标检测层，适配柑橘果面微小病害斑点；
对比实验与结果分析：设置YOLOv5s、YOLOv8s、原生YOLOv11s、改进YOLOv11s四组对照，从精度、参数量、推理速度三维度验证模型性能；
工程部署可行性分析：基于轻量化模型输出ONNX权重，完成嵌入式设备推理速度测试，验证果园流水线实时检测能力。

1.3.2 技术路线

数据集采集与标注→数据清洗、格式转换、数据增强→划分训练集/验证集/测试集→搭建原生YOLOv11s基线模型→引入注意力、损失函数、检测层改进→模型训练与超参调优→多模型对比消融实验→指标结果分析→模型轻量化导出与部署测试。

1.4 论文组织结构

本文共分为六个章节：第一章绪论阐述研究背景、国内外现状、研究内容；第二章介绍数据集基础信息与预处理方案；第三章详细讲解YOLOv11网络原理与本文改进策略；第四章设计实验方案、评价指标并分析实验结果；第五章完成模型嵌入式部署测试；第六章总结全文并展望后续优化方向。

二、柑橘病害数据集构建与预处理

2.1 数据集基础信息

本文实验采用柑橘果实病害私有标注数据集，全部图像为果园现场工业相机实拍，包含反光、阴影、果实堆叠、不同成熟度等真实复杂场景，无实验室纯色背景理想图片，贴合实际分拣工况。数据集整体参数如下表所示：

序号	类别名称	中文病害名称	标注框数量	含该类图片数量
1	blacksopt	黑斑病	4276	986
2	Canker	溃疡病	2265	1291
3	Greening	黄龙病	3294	1289
4	Healthy	健康果	2329	1259
-	合计	-	12164	4834

数据集共4834张独立柑橘果实图像，每张图像对应VOC（.xml）、YOLO（.txt）两种标注文件，标注框完整框选果面病害区域与完整健康果实，类别共4类。从数据分布可明显看出样本不均衡问题：黑斑病标注框数量最多（4276个），溃疡病标注框最少（2265个），二者数量差距近一倍；健康果图片基数最大，单张图片仅含完整果实大目标，黑斑、溃疡病斑多为小尺度细碎目标，尺度跨度极大，会造成模型训练时偏向样本量大、大尺度目标类别，小病害斑点漏检、错检概率上升。

2.2 数据集格式统一与清洗

原始数据集同时提供VOC与YOLO两种标注格式，YOLO训练框架仅支持txt归一化坐标标注，因此第一步完成全量标注格式统一：

编写Python脚本批量读取xml文件，将VOC像素坐标（xmin,ymin,xmax,ymax）转换为YOLO归一化中心坐标格式（class_id, x_center, y_center, w, h）；
数据清洗：遍历全部图片与标注文件，剔除无标注空白图、标注坐标越界、模糊严重无法识别病害的低质量图像，最终保留有效样本4792张；
类别映射编码：设置类别索引对应关系：0-blacksopt、1-Canker、2-Greening、3-Healthy，统一所有txt标注文件类别ID，避免标签错乱。

2.3 数据集划分与均衡化增强

2.3.1 分层随机划分

按照训练集:验证集:测试集=7:2:1分层随机划分，分层规则保证三类病害、健康果在三个子集内类别分布比例与原数据集一致，避免某一子集缺失稀有病害样本。划分后训练集3354张、验证集958张、测试集480张。

2.3.2 多策略数据增强方案

针对样本不均衡、小目标病害特征不明显两大问题，采用组合增强策略在线生成训练样本，仅对训练集启用增强，验证、测试集保持原图保证评估真实性：

Mosaic4增强：随机选取4张图片拼接，随机缩放、翻转、裁剪，丰富果实堆叠、多病害同框场景，扩充小目标样本；
Copy-Paste复制粘贴增强：提取溃疡、黑斑小病害标注框，随机粘贴至其他柑橘果实图像，增加稀有病害类别标注框数量，缓解类别不均衡；
光学扰动增强：随机调整亮度、对比度、饱和度、高斯模糊、模拟果面反光噪声，提升模型光照鲁棒性；
几何变换增强：随机水平翻转、小幅旋转、缩放、平移，避免模型过拟合果实固定摆放角度。

2.4 数据集配置文件构建

按照YOLO标准目录结构组织数据集，创建dataset.yaml配置文件，定义类别数量nc=4、类别名称names列表、训练/验证/测试集图片路径，模型训练时直接读取配置文件加载数据，目录结构规范如下：

citrus_dataset/
├── images/
│   ├── train/
│   ├── val/
│   └── test/
├── labels/
│   ├── train/
│   ├── val/
│   └── test/
└── dataset.yaml

三、YOLOv11网络架构与模型改进设计

3.1 YOLO系列网络迭代演进

YOLO（You Only Look Once）是单阶段端到端目标检测算法，凭借速度与精度平衡优势广泛应用于工业视觉检测。2016年至2025年YOLO系列持续迭代：YOLOv1-v3奠定基础网格检测思路；YOLOv5引入CSPDarknet轻量化主干；YOLOv7创新ELAN高效层；YOLOv8解耦检测头、引入Anchor-Free；YOLOv9全局梯度信息流机制；2025年Ultralytics推出最新YOLOv11，在主干、颈部、检测头、损失函数全链路完成升级，分为n/s/m/l/x多尺度版本，其中YOLOv11s兼顾轻量化与精度，适配本研究嵌入式部署需求。

相较于前代YOLOv8s，YOLOv11s核心升级点：

主干网络替换为改进C2f模块，精简残差分支，降低计算量同时强化浅层小目标特征提取；
颈部PAN-FPN融合轻量化SPPF-Large模块，扩大感受野，捕捉果面大范围黄龙斑驳区域；
原生解耦检测头轻量化，分类、回归分支通道数压缩30%，参数量大幅下降；
内置动态匹配损失策略，对小目标、稀有类别自动分配更高损失权重，天然缓解样本不均衡；
推理引擎优化，支持INT8量化、TensorRT加速，嵌入式设备推理延迟显著降低。

3.2 原生YOLOv11s完整网络结构

YOLOv11整体分为三大模块：Backbone主干特征提取网络、Neck颈部多尺度特征融合网络、Head解耦检测头输出预测结果。

Backbone主干：由Conv基础卷积、C2f轻量化残差块、SPPF空间金字塔池化层串联构成。浅层卷积提取果面纹理、微小病斑边缘细节，深层卷积提取果实整体轮廓、大面积黄龙病斑语义特征，输出3种不同尺度特征图（小、中、大）送入颈部融合；
Neck颈部PAN-FPN：采用自上而下上采样+自下而上下采样双向特征融合，将深层全局语义特征与浅层细节特征拼接，解决小病害斑点深层特征丢失问题，输出三组融合后特征图；
Head检测头：Anchor-Free无锚框解耦结构，分类分支输出4类病害置信度，回归分支输出目标框坐标、置信度，简化计算，消除锚框预定义带来的适配误差。

3.3 面向柑橘病害检测的模型改进策略

原生YOLOv11s虽具备基础性能，但针对柑橘数据集小目标多、类别不均衡场景仍存在优化空间，本文提出三项针对性改进：

3.3.1 嵌入CA轻量化注意力机制

CA（Coordinate Attention）坐标注意力模块参数量仅0.1M，相比CBAM、SE注意力计算开销更低。将CA模块插入主干C2f输出端，分别对水平、垂直方向特征编码，精准定位果面局部微小黑斑、溃疡斑点，抑制果皮褶皱、反光等背景噪声干扰，强化病害区域特征权重。

3.3.2 替换CIoU损失函数优化边界框回归

原生YOLOv11默认DIoU损失，未考虑框长宽比差异；柑橘病害标注框形态差异极大：健康果为大矩形框，黑斑病斑为细长不规则小框。采用CIoU损失，在交并比、中心点距离基础上增加长宽比惩罚项，加速病斑框收敛，提升小病害定位精度。CIoU损失公式：
$LCIoU=1−IoU+ρ2(b,bgt)c2+αvL_{CIoU}=1-IoU+\frac{\rho^2(b,b_{gt})}{c^2}+\alpha v$
其中 $ρ\rho$ 为预测框与真实框中心点欧氏距离， $c$ 为最小外接矩形对角线长度， $v$ 衡量长宽比相似度， $α\alpha$ 为平衡权重系数。

3.3.3 扩充微小目标检测层

原生YOLOv11仅三层检测头，最小特征图下采样倍数8，针对直径小于30像素的微小溃疡、黑斑斑点提取能力不足。新增第四层超小目标检测分支，对主干浅层高分辨率特征图单独输出预测，专门负责细小病斑检测，缩小小目标漏检率。

3.4 模型训练超参数设置

训练硬件环境：NVIDIA RTX 4090 24G显卡，CUDA12.5，PyTorch2.5深度学习框架；基础超参配置如下：

输入图像尺寸：640×640；
批次大小batch_size=16；
迭代轮次epochs=200；
优化器：AdamW优化器，初始学习率lr0=0.001；
学习率衰减：余弦退火策略；
权重衰减weight_decay=0.0005；
置信度阈值conf_thres=0.25，NMS非极大抑制iou_thres=0.7；
预训练权重：COCO公开数据集YOLOv11s预训练权重迁移学习，加速收敛。

四、实验结果与分析

4.1 模型评价指标

采用目标检测通用定量评价指标，全面衡量模型精度、速度、参数量：

AP（Average Precision）：单类别平均精度，反映单一病害类别检测效果；
mAP@0.5：IoU阈值0.5时全部类别平均精度，核心综合精度指标；
Recall召回率：真实病害目标被正确检出比例，衡量漏检程度；
Precision精确率：预测病害框真实有效比例，衡量误检程度；
Params参数量：模型总权重参数，表征轻量化水平；
Inference Time单图推理耗时：640尺寸图片GPU单次前向传播时间，表征实时性。

4.2 多模型基线对比实验

选取YOLOv5s、YOLOv8s、原生YOLOv11s、本文改进YOLOv11s四组模型在相同数据集、相同超参下训练，对比结果如下表：

模型	mAP@0.5(%)	平均Recall(%)	Params(M)	单图推理时间(ms)
YOLOv5s	87.2	83.6	7.3	21
YOLOv8s	91.5	88.1	5.1	17
原生YOLOv11s	93.1	90.4	3.4	13
改进YOLOv11s(本文)	94.7	92.8	3.8	12

从对比结果可得出三点结论：

同轻量化尺度下，YOLOv11系列全面优于YOLOv5、YOLOv8前代网络。原生YOLOv11s相比YOLOv8s mAP提升1.6%，参数量减少1.7M，推理速度提升4ms，验证2025最新网络架构的性能优势；
本文三项改进策略有效提升检测精度，mAP@0.5相比原生YOLOv11s上涨1.6%，召回率提升2.4%，仅小幅增加0.4M参数量，推理速度反而缩短1ms，CA注意力、CIoU损失、小目标检测层对柑橘病害场景适配性极强；
改进后模型参数量仅3.8M，单图推理12ms，每秒可处理80张以上640分辨率图像，完全满足果园流水线20~30帧/秒实时检测需求。

4.3 单类别检测精度分析

测试集四类目标AP值统计如下：

Healthy（健康果）AP=96.3%：健康果为大尺度完整目标，特征简单清晰，模型识别精度最高；
Greening（黄龙病）AP=95.1%：黄龙病斑驳区域面积大，特征区分度高，检测效果次优；
blacksopt（黑斑病）AP=94.2%：黑斑斑点尺寸跨度大，大斑点识别稳定，微小斑点存在少量漏检；
Canker（溃疡病）AP=92.5%：溃疡病微小斑点占比最高，标注框总量最少，是模型识别难点，但经Copy-Paste增强与小目标检测层优化后，AP仍达到92.5%，满足工业使用标准。

4.4 消融实验验证改进有效性

为验证三项改进模块各自增益，设计消融实验，以原生YOLOv11s为基线，逐步叠加改进策略，结果如下：

实验编号	CA注意力	CIoU损失	超小目标检测层	mAP@0.5(%)
基线	×	×	×	93.1
1	√	×	×	93.7
2	√	√	×	94.2
3	√	√	√	94.7

消融实验分析：

仅添加CA注意力模块，mAP提升0.6%，证明坐标注意力可有效过滤果皮噪声，强化病害局部特征；
叠加CIoU损失后，mAP再提升0.5%，针对不规则病斑框回归优化效果显著；
全部三项改进叠加后，mAP最终提升1.6%，超小目标检测层解决微小溃疡、黑斑漏检问题，三项改进形成互补增益。

4.5 可视化检测效果分析

随机选取测试集复杂场景图片可视化推理结果：果实堆叠、强光反光、多病害同框图像中，改进YOLOv11s均可精准定位细小黑斑、溃疡斑点，无大面积漏检、误检；对于边界模糊的黄龙斑驳区域，模型分类置信度稳定在0.85以上；健康果无病害干扰，不会将果皮天然纹理误判为病害，模型泛化能力强，能够适配果园分拣复杂成像环境。

五、模型轻量化部署方案

5.1 模型量化导出

训练完成的最优YOLOv11s权重文件采用Ultralytics内置导出工具转换：

导出ONNX通用中间格式，兼容TensorRT、OpenVINO、NCNN全部嵌入式推理框架；
INT8量化压缩：基于柑橘校准数据集量化权重，模型存储空间从15MB压缩至4.2MB，精度损失仅0.3%，可存储于树莓派、Jetson Nano小型终端；
部署推理脚本：编写Python实时检测代码，读取工业相机视频流，逐帧输出病害类别、位置、置信度，联动分拣机械臂实现自动分选。

5.2 嵌入式设备推理测试

选用果园常用低成本Jetson Nano 4G嵌入式开发板测试推理速度：

FP32浮点模型：单图推理38ms；
INT8量化模型：单图推理18ms，帧率稳定55FPS，满足流水线高速分拣实时性要求。

六、总结与展望

6.1 全文总结

针对柑橘黑斑病、溃疡、黄龙、健康果四类果实同步检测需求，本文基于2025年最新YOLOv11轻量化网络完成整套检测方案设计，围绕数据集不均衡、微小病害目标难识别两大痛点开展系统研究，主要工作如下：

完成4834张柑橘病害数据集清洗、格式统一、分层划分，采用Mosaic、Copy-Paste组合数据增强缓解类别标注框数量不均衡问题；
深入剖析YOLOv11s原生网络架构，对比前代YOLOv5/v8架构升级优势，引入CA坐标注意力、CIoU损失、超小目标检测层三项改进，适配柑橘果面病害检测场景；
多模型对比实验证明改进YOLOv11s综合性能最优，mAP@0.5达到94.7%，参数量仅3.8M，GPU推理12ms，嵌入式量化后帧率可达55FPS；消融实验验证三项改进模块均可稳定提升检测精度；
完成模型量化与嵌入式部署测试，方案可直接应用于果园自动化分拣流水线，替代人工目视筛查，降低生产成本。