跨模态行人重识别AGW完美复现

最新推荐文章于 2026-04-17 10:26:56 发布

原创最新推荐文章于 2026-04-17 10:26:56 发布 · 3.1k 阅读

·

12

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#计算机视觉 #行人重识别 #论文笔记

行人重识别专栏收录该内容

4 篇文章

订阅专栏

低功耗蓝牙项目，需要一块懂省电的板

思澈 SF32LB52 芯片，BLE 协议栈深度优化，上手即开发

点击查看

一、前言

源代码：https://github.com/mangye16/Cross-Modal-Re-ID-baseline

原文：Deep Learning for Person Re-identification: A Survey and Outlook

里面提到新baseline

在resnet50的基础上增加了一个Non-local Attention，主要是1x1的卷积核，详情可以找源论文观看

以下是官方给的实现实验结果，sysu-mm01和regdb两个数据集可以网上找下载

下载源代码之后,data_loader.py数据集，data_manger.py数据集处理，可以设置sysu-mm01的all-search和indoor-search，也可以设置regdb的visible to infrared 和infrared to visible，sysu-mm01需要先运行pre_processing_sysu.py处理成.npy文件。

二、数据集介绍

SYSU-MM01 数据集是 2017 年为研究跨模态行人重识别问题而提出的公开数据集，它包含了在白天的 4 个用于捕捉 RGB 图像的摄像视域以及在黑暗环境中用于捕捉红外图像的摄像视域，共有 491 个不同身份行人的 287628 张 RGB 图像和 15792 张红外图像。

SYSU_MM01数据集共包含七个文件夹，其中cam1，cam2，cam4，cam5均为RGB图像，cam3和cam6为IR(Infrared)图像

RegDB 数据集共有 412 个不同身份的行人，分为 254 个女性和 158 个男性，每个人分别对应 10 张RGB 图像和 10 张红外图像，其中拍摄到 156 个行人的正面，256 个行人的背面。该数据集总共有 4120 张RGB 图像和 4120 张的红外图像。

三、训练过程

可以租Autodl的服务器，我用的RTX4090，

修改train.py的argparse里面的参数，一般默认就行，有需要可以自己改

修改文件夹位置

修改data_load.py中的文件位置

运行

python train.py --dataset sysu --lr 0.1 --method agw --gpu 1

python test.py --mode all --resume 'model_path' --gpu 1 --dataset sysu

默认batch_size=8,epochs=80，完成之后结果如下

有问题可以私聊！！！

低功耗蓝牙项目，需要一块懂省电的板

思澈 SF32LB52 芯片，BLE 协议栈深度优化，上手即开发

点击查看

官方同款运行环境

🎭 Face3D.ai Pro

Face3D.ai 是一个将前沿 AI 视觉算法与现代化工业 UI 设计相结合的 Web 应用。通过集成的 ResNet50 面部拓扑回归模型，本系统能够从单张 2D 正面照片中实时还原高精度的 3D 人脸几何结构，并生成 4K 级的 UV 纹理贴图。

AI应用

人脸建模

PyTorch

Python

显存大小

24GB

CPU

10核心

内存

120GB

系统盘/数据盘

40GB

无需本地环境部署，可直接运行

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

我是埃文 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。