复杂场景多目标跟踪新突破!RGTrack 算法:精度、速度、轻量化三管齐下

点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12431453/pdf/sensors-25-05325.pdf

Column of Computer Vision Institute

本文提出的全新RGTrack模型,用重参数化卷积 + 全局注意力 + 多级关联策略,实现跟踪精度、推理速度、模型轻量化全面提升,特别适合嵌入式与资源受限设备。

PART/1

    背景   

当前主流多目标跟踪分为两类:

  • 两阶段(SDE):检测 + 重识别分开做,精度高但速度慢,难实时。
  • 单阶段(JDE):检测与特征提取一体化,速度快,但在密集遮挡场景下

ID 不稳定、跟踪精度不足

代表性 JDE 模型 CSTrack 虽缓解了任务竞争问题,但面对复杂环境仍有明显短板:

  1. 特征提取对关键区域聚焦不足

  2. 多尺度特征融合能力有限

  3. 帧间目标关联策略不够稳健

  4. 身份切换(ID Switch)现象依然严重

PART/2

     创新   

RGTrack 以 YOLOv5 为基础框架,围绕特征更强、关联更稳、速度更快做了三大关键创新。

1. 全局上下文 GC 注意力:精准抓关键

在主干网络加入GC Block,兼顾 Non-local 的全局建模能力与 SE 的高效计算,让网络自动忽略冗余信息,聚焦目标主体。

作用:显著提升密集、遮挡下的检测与特征判别力。

2. 重参数化 RepConv:训练多分支、推理单路

在 Neck 特征融合层替换为RepVGG 卷积

  • 训练:用多分支结构提升特征表达

  • 推理:融合为单路 3×3 卷积,不增加推理耗时

作用:增强特征融合,同时保持高速推理。

3. 多级关联策略:稳住 ID 不漂移

基于卡尔曼滤波,设计四级匹配流程,结合外观特征 + GIOU 位置信息:

  1. 高分检测→跟踪轨迹匹配

  2. 高分检测→未匹配跟踪轨迹匹配

  3. 低分检测→跟踪状态轨迹匹配

  4. 高分检测→未确定轨迹匹配

作用:大幅降低 ID 切换,提升跟踪连续性。

【RGTrack 整体网络结构】

PART/3

     效果    

效果:精度↑速度↑体积↓全面领先

团队在 MOT16/17 权威数据集上验证,对比基线 CSTrack,RGTrack 实现全方位提升

核心指标提升

  • MOTA(跟踪精度):+1.15%

  • IDF1(身份匹配):+1.73%

  • MT(完整跟踪率):+6.86%

  • ID Switch(身份切换):-47.49%

速度与轻量化

  • FPS(推理速度):+51.48%

  • 模型体积:-3.08%

【MOT16 测试集不同方法对比结果】

可视化对比

在密集人群场景中:

  • CSTrack 频繁漏检、错检,ID 易混乱

  • RGTrack 完整检出目标,身份稳定不漂移

【CSTrack 与 RGTrack 检测效果对比】

【CSTrack 与 RGTrack 跟踪效果对比】

PART/4

    总结与展望    

RGTrack 证明:单阶段 JDE 框架可以在复杂场景下做到 “高精度 + 高实时 + 轻量化”。它通过全局注意力强化特征、重参数化兼顾性能与速度、多级关联稳定身份,完美适配智能监控、自动驾驶、机器人等落地场景。

未来团队将进一步探索:

  • 多模态数据融合(RGB + 深度 + 激光雷达)

  • 长时间遮挡后的重识别

  • 更极致的轻量化与端侧部署

在真实复杂视觉场景中,RGTrack 为多目标跟踪提供了一套实用、高效、可落地的新方案。


有相关需求的你可以联系我们!

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!


往期推荐 

🔗

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机视觉研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值