Kaggle landmarks recognition所用,仅此记录。
import sys, os, csv
def parse_data(data_file):
csvfile = open(data_file, 'r')
csvreader = csv.reader(csvfile)
key_url_id_list = [line[:3] for line in csvreader]
return key_url_id_list
def find_id(key_url_id_list, j):
for i in range(1,len(key_url_id_list)):
key_url_id = key_url_id_list[i]
(key, url, id) = key_url_id
if int(id) == j:
print(key,id)
f = open(csvname, 'a', newline='') #'a'为接着写,'w'直接覆盖
badfile = [key + '.jpg', id]
with f:
writer = csv.writer(f)
writer.writerow(badfile)
break
def find_all():
for j in range(1,14950):
find_id(key_url_id_list, j)
csvname = 'C:/Users/81080/Desktop/class.csv'
key_url_id_list = parse_data('C:/Users/81080/Desktop/train.csv')
find_all()
本文介绍了一个用于处理Kaggle地标识别竞赛数据的Python脚本,该脚本能够从CSV文件中读取关键信息,并针对每个ID查找对应的地标名称及图片链接,最后将这些信息保存到新的CSV文件中,以便进一步的数据分析与处理。

4968

被折叠的 条评论
为什么被折叠?



