Python3每类图片取一张

本文介绍了一个用于处理Kaggle地标识别竞赛数据的Python脚本,该脚本能够从CSV文件中读取关键信息,并针对每个ID查找对应的地标名称及图片链接,最后将这些信息保存到新的CSV文件中,以便进一步的数据分析与处理。

Kaggle landmarks recognition所用,仅此记录。

import sys, os, csv

def parse_data(data_file):
    csvfile = open(data_file, 'r')
    csvreader = csv.reader(csvfile)
    key_url_id_list = [line[:3] for line in csvreader]
    return key_url_id_list

def find_id(key_url_id_list, j):
    for i in range(1,len(key_url_id_list)):
        key_url_id = key_url_id_list[i]
        (key, url, id) = key_url_id
        if int(id) == j:
            print(key,id)
            f = open(csvname, 'a', newline='')   #'a'为接着写,'w'直接覆盖
            badfile = [key + '.jpg', id]
            with f:
                writer = csv.writer(f)
                writer.writerow(badfile)
            break

def find_all():
    for j in range(1,14950):
        find_id(key_url_id_list, j)

csvname = 'C:/Users/81080/Desktop/class.csv'
key_url_id_list = parse_data('C:/Users/81080/Desktop/train.csv')
find_all()

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值