Python3每类图片取一张

最新推荐文章于 2024-03-13 19:36:44 发布

原创最新推荐文章于 2024-03-13 19:36:44 发布 · 385 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#Python

收录于

Kaggle landmarks recognition 专栏收录该内容

4 篇文章

订阅专栏

本文介绍了一个用于处理Kaggle地标识别竞赛数据的Python脚本，该脚本能够从CSV文件中读取关键信息，并针对每个ID查找对应的地标名称及图片链接，最后将这些信息保存到新的CSV文件中，以便进一步的数据分析与处理。

Kaggle landmarks recognition所用，仅此记录。

import sys, os, csv

def parse_data(data_file):
    csvfile = open(data_file, 'r')
    csvreader = csv.reader(csvfile)
    key_url_id_list = [line[:3] for line in csvreader]
    return key_url_id_list

def find_id(key_url_id_list, j):
    for i in range(1,len(key_url_id_list)):
        key_url_id = key_url_id_list[i]
        (key, url, id) = key_url_id
        if int(id) == j:
            print(key,id)
            f = open(csvname, 'a', newline='')   #'a'为接着写，'w'直接覆盖
            badfile = [key + '.jpg', id]
            with f:
                writer = csv.writer(f)
                writer.writerow(badfile)
            break

def find_all():
    for j in range(1,14950):
        find_id(key_url_id_list, j)

csvname = 'C:/Users/81080/Desktop/class.csv'
key_url_id_list = parse_data('C:/Users/81080/Desktop/train.csv')
find_all()