复杂场景多目标跟踪新突破！RGTrack 算法：精度、速度、轻量化三管齐下

最新推荐文章于 2026-06-24 06:59:28 发布

原创最新推荐文章于 2026-06-24 06:59:28 发布 · 324 阅读

·

12

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#目标跟踪 #算法 #人工智能 #计算机视觉 #机器学习

点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜计算机视觉研究院

学习群｜扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12431453/pdf/sensors-25-05325.pdf

Column of Computer Vision Institute

本文提出的全新RGTrack模型，用重参数化卷积 + 全局注意力 + 多级关联策略，实现跟踪精度、推理速度、模型轻量化全面提升，特别适合嵌入式与资源受限设备。

PART/1

背景

当前主流多目标跟踪分为两类：

两阶段（SDE）：检测 + 重识别分开做，精度高但速度慢，难实时。
单阶段（JDE）：检测与特征提取一体化，速度快，但在密集遮挡场景下

ID 不稳定、跟踪精度不足。

代表性 JDE 模型 CSTrack 虽缓解了任务竞争问题，但面对复杂环境仍有明显短板：

特征提取对关键区域聚焦不足
多尺度特征融合能力有限
帧间目标关联策略不够稳健
身份切换（ID Switch）现象依然严重

PART/2

创新

RGTrack 以 YOLOv5 为基础框架，围绕特征更强、关联更稳、速度更快做了三大关键创新。

1. 全局上下文 GC 注意力：精准抓关键

在主干网络加入GC Block，兼顾 Non-local 的全局建模能力与 SE 的高效计算，让网络自动忽略冗余信息，聚焦目标主体。

作用：显著提升密集、遮挡下的检测与特征判别力。

2. 重参数化 RepConv：训练多分支、推理单路

在 Neck 特征融合层替换为RepVGG 卷积：

训练：用多分支结构提升特征表达
推理：融合为单路 3×3 卷积，不增加推理耗时

作用：增强特征融合，同时保持高速推理。

3. 多级关联策略：稳住 ID 不漂移

基于卡尔曼滤波，设计四级匹配流程，结合外观特征 + GIOU 位置信息：

高分检测→跟踪轨迹匹配
高分检测→未匹配跟踪轨迹匹配
低分检测→跟踪状态轨迹匹配
高分检测→未确定轨迹匹配

作用：大幅降低 ID 切换，提升跟踪连续性。

【RGTrack 整体网络结构】

PART/3

效果

效果：精度↑速度↑体积↓全面领先

团队在 MOT16/17 权威数据集上验证，对比基线 CSTrack，RGTrack 实现全方位提升：

核心指标提升

MOTA（跟踪精度）：+1.15%
IDF1（身份匹配）：+1.73%
MT（完整跟踪率）：+6.86%
ID Switch（身份切换）：-47.49%

速度与轻量化

FPS（推理速度）：+51.48%
模型体积：-3.08%

【MOT16 测试集不同方法对比结果】

可视化对比

在密集人群场景中：

CSTrack 频繁漏检、错检，ID 易混乱
RGTrack 完整检出目标，身份稳定不漂移

【CSTrack 与 RGTrack 检测效果对比】

【CSTrack 与 RGTrack 跟踪效果对比】

PART/4

总结与展望

RGTrack 证明：单阶段 JDE 框架可以在复杂场景下做到 “高精度 + 高实时 + 轻量化”。它通过全局注意力强化特征、重参数化兼顾性能与速度、多级关联稳定身份，完美适配智能监控、自动驾驶、机器人等落地场景。

未来团队将进一步探索：

多模态数据融合（RGB + 深度 + 激光雷达）
长时间遮挡后的重识别
更极致的轻量化与端侧部署

在真实复杂视觉场景中，RGTrack 为多目标跟踪提供了一套实用、高效、可落地的新方案。

有相关需求的你可以联系我们！

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

往期推荐

🔗

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

计算机视觉研究院 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。