一、前言
源代码:https://github.com/mangye16/Cross-Modal-Re-ID-baseline
原文:Deep Learning for Person Re-identification: A Survey and Outlook
里面提到新baseline
在resnet50的基础上增加了一个Non-local Attention,主要是1x1的卷积核,详情可以找源论文观看
以下是官方给的实现实验结果,sysu-mm01和regdb两个数据集可以网上找下载

下载源代码之后,data_loader.py数据集,data_manger.py数据集处理,可以设置sysu-mm01的all-search和indoor-search,也可以设置regdb的visible to infrared 和infrared to visible,sysu-mm01需要先运行pre_processing_sysu.py处理成.npy文件。

二、数据集介绍
SYSU-MM01 数据集是 2017 年为研究跨模态行人重识别问题而提出的公开数据集,它包含了在白天的 4 个用于捕捉 RGB 图像的摄像视域以及在黑暗环境中用于捕捉红外图像的摄像视域,共有 491 个不同身 份 行 人 的 287628 张 RGB 图 像 和 15792 张 红外图像。
SYSU_MM01数据集共包含七个文件夹, 其中cam1,cam2,cam4,cam5均为RGB图像,cam3和cam6为IR(Infrared)图像
RegDB 数据集共有 412 个不同身份的行人,分为 254 个女性和 158 个男性,每个人分别对应 10 张RGB 图像和 10 张红外图像,其中拍摄到 156 个行人的正面,256 个行人的背面。该数据集总共有 4120 张RGB 图像和 4120 张的红外图像。
三、训练过程
可以租Autodl的服务器,我用的RTX4090,
修改train.py的argparse里面的参数,一般默认就行,有需要可以自己改
修改文件夹位置

修改data_load.py中的文件位置

运行
python train.py --dataset sysu --lr 0.1 --method agw --gpu 1
python test.py --mode all --resume 'model_path' --gpu 1 --dataset sysu
默认batch_size=8,epochs=80,完成之后结果如下

有问题可以私聊!!!

6073

被折叠的 条评论
为什么被折叠?



