CelebA数据集介绍以及预处理代码

本文介绍了CelebA数据集的详细内容,包括数据地址、文件类别和各个文件的作用。数据集分为Anno、Eval和img文件夹,提供了人脸标注信息和图片。在数据处理部分,作者分享了将图片按身份ID归类的预处理代码,并展示了处理后的效果。

数据地址:
官网地址:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
文件类别:

我是从官网的百度云连接里下载的,下载之后一共四个文件
下面我们一 一看过文件内容
在这里插入图片描述

Anno文件夹

第一个文件夹Anno,存放的是各类标签

比如第一个identity_CelebA.txt是图片与 所对应的身份id
list_bbox标签,是人脸标注框坐标注释文件,包含每一张图片对应的bbox起点坐标及其宽高
list_landmarks_align_celeba.txt则是对应人脸对齐后 的landmark坐标
在这里插入图片描述

Eval文件夹

这里是将数据集分成了三部分

train(标0的部分)
valid(标1的部分)
test(标2的部分)
在这里插入图片描述
在这里插入图片描述

img文件夹

文件包括这三部分

img_align_celeba 是裁剪过的并以.jpg结尾的图片,占内存较小
img_align_celeba_png.7z
img_celeba.7z是未经裁剪的图片,故称野生照片
在这里插入图片描述
在这里插入图片描述

数据处理及详细代码
  • 因为我这里需要将每个人的图片放到对应的id文件下,所以我需要通过代码进行预处理,下面就直接贴代码了,以及效果图
# -*- coding: utf-8 -*-
# !/usr/bin/env python3

'''
Divide face accordance CelebA Id type.
'''


import shutil
import os

output_path_train = r"C:\Users\rugu\Desktop\train"
output_path_valid = r
评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值