基于轻量级模型YOLOX-Nano的菜品识别系统

最新推荐文章于 2026-04-08 05:44:15 发布

原创

最新推荐文章于 2026-04-08 05:44:15 发布 · 2.6k 阅读

标签

#深度学习 #目标检测 #yolox-nano #菜品识别

本文介绍了YOLOX-Nano，一种高性能的无锚框目标检测器，着重于其网络结构、主要改进（如解耦头、数据增强和轻量化），以及在实验环境下的训练过程和结果。YOLOX-Nano在保持高精度的同时，适用于移动设备部署，具有工业价值。

工程Gitee地址：
https://gitee.com/zhong-liangtang/ncnn-android-yolox-nano

一、YOLOX简介

YOLOX是一个在2021年被旷视科技公司提出的高性能且无锚框（Anchor-free）的检测器，在YOLO系列的基础上吸收近年来目标检测学术界的最新成果，如解耦头（Decoupled Head）、数据增强、无锚框、标签分配策略SimOTA（Simplified Optimal Transport Assignment）等等。同时YOLOX继承了YOLO系列容易部署的特点，提供了支持ONNX、TensorRT、ncnn和Openvino的部署版本。

二、YOLOX网络结构

YOLOX的网络有多种版本，本文介绍YOLOX-Nano的网络结构，它由四个部分构成，分别为输入端、用于特征提取的主干网络（Backbone）、用于特征融合的颈部网络（Neck）以及预测（Prediction）。YOLOX-Nano模型网络结构图如下所示。
在这里插入图片描述

输入端采取了Mosaic和Mixup两种数据增强方法，在输入图片时将图片的高和宽统一进行等比例转换。
主干网络使用CSPDarknet网络进行特征提取，CSPDarknet网络利用52层卷积神经网络进行特征提取，1层利用1×1卷积作为全连接层，共计53层卷积神经网络。在特征提取时，会把在特征提取过程中三部分不同尺度的特征信息直接和下一部分的颈部网络相连接。
颈部网络使用FPN结构进行特征融合，在该部分，已经在主干网络获得的特征会结合不同尺度的特征信息来进一步进行特征提取，使模型的性能以及小目标的检测能力得到提升

最低0.47元/天解锁文章