数据地址:
官网地址:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
文件类别:
我是从官网的百度云连接里下载的,下载之后一共四个文件
下面我们一 一看过文件内容
Anno文件夹
第一个文件夹Anno,存放的是各类标签
比如第一个identity_CelebA.txt是图片与 所对应的身份id
list_bbox标签,是人脸标注框坐标注释文件,包含每一张图片对应的bbox起点坐标及其宽高
list_landmarks_align_celeba.txt则是对应人脸对齐后 的landmark坐标
Eval文件夹
这里是将数据集分成了三部分
train(标0的部分)
valid(标1的部分)
test(标2的部分)
img文件夹
文件包括这三部分
img_align_celeba 是裁剪过的并以.jpg结尾的图片,占内存较小
img_align_celeba_png.7z
img_celeba.7z是未经裁剪的图片,故称野生照片
数据处理及详细代码
- 因为我这里需要将每个人的图片放到对应的id文件下,所以我需要通过代码进行预处理,下面就直接贴代码了,以及效果图
# -*- coding: utf-8 -*-
# !/usr/bin/env python3
'''
Divide face accordance CelebA Id type.
'''
import shutil
import os
output_path_train = r"C:\Users\rugu\Desktop\train"
output_path_valid = r

本文介绍了CelebA数据集的详细内容,包括数据地址、文件类别和各个文件的作用。数据集分为Anno、Eval和img文件夹,提供了人脸标注信息和图片。在数据处理部分,作者分享了将图片按身份ID归类的预处理代码,并展示了处理后的效果。







1万+

被折叠的 条评论
为什么被折叠?



