跨模态行人重识别AGW完美复现

低功耗蓝牙项目,需要一块懂省电的板

思澈 SF32LB52 芯片,BLE 协议栈深度优化,上手即开发

一、前言

源代码:https://github.com/mangye16/Cross-Modal-Re-ID-baseline

原文:Deep Learning for Person Re-identification: A Survey and Outlook

里面提到新baseline

在resnet50的基础上增加了一个Non-local Attention,主要是1x1的卷积核,详情可以找源论文观看

以下是官方给的实现实验结果,sysu-mm01和regdb两个数据集可以网上找下载

下载源代码之后,data_loader.py数据集,data_manger.py数据集处理,可以设置sysu-mm01的all-search和indoor-search,也可以设置regdb的visible to infrared 和infrared to visible,sysu-mm01需要先运行pre_processing_sysu.py处理成.npy文件。

二、数据集介绍

SYSU-MM01 数据集是 2017 年为研究跨模态行人重识别问题而提出的公开数据集,它包含了在白天的 4 个用于捕捉 RGB 图像的摄像视域以及在黑暗环境中用于捕捉红外图像的摄像视域,共有 491 个不同身 份 行 人 的 287628 张 RGB 图 像 和 15792 张 红外图像。

SYSU_MM01数据集共包含七个文件夹, 其中cam1,cam2,cam4,cam5均为RGB图像,cam3和cam6为IR(Infrared)图像

RegDB 数据集共有 412 个不同身份的行人,分为 254 个女性和 158 个男性,每个人分别对应 10 张RGB 图像和 10 张红外图像,其中拍摄到 156 个行人的正面,256 个行人的背面。该数据集总共有 4120 张RGB 图像和 4120 张的红外图像。

三、训练过程

可以租Autodl的服务器,我用的RTX4090,

修改train.py的argparse里面的参数,一般默认就行,有需要可以自己改

修改文件夹位置

修改data_load.py中的文件位置

运行

python train.py --dataset sysu --lr 0.1 --method agw --gpu 1
python test.py --mode all --resume 'model_path' --gpu 1 --dataset sysu

默认batch_size=8,epochs=80,完成之后结果如下

有问题可以私聊!!!

低功耗蓝牙项目,需要一块懂省电的板

思澈 SF32LB52 芯片,BLE 协议栈深度优化,上手即开发

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是埃文

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值