有时对于爬虫得到的数据,需要对其进行整理,一是为了格式统一,二是用excel表格也可以打开。再就是把得到的数据放入数据库都是需要的。
首先来看导成csv:
我认为最重要的一点是,如何把文本数据取出来放入类似二维数组的字符串组来保存。关键就在于如何取。
可以观察到这些数据以此的顺序,因此:
with open('info.txt','r') as file:
while True:
line=file.readline()
if line=='':
break
if len(line.split('\r')[0])==1:
continue
print len(line.split('\n')[0])
info.append(line.split('\n')[0])
# /r 和 /n 的区别?
count=0
for i in info:
print "测试",i
count=count+1
print "数量",count
data=[("1","2","3","4")]
for i in range(0,count,4):
str=(info[

本文介绍了如何将爬虫获取的数据整理成csv文件,并存入Postgres数据库。首先,通过解析文本数据形成二维数组,然后利用Python的csv库将数据写入csv。针对可能出现的乱码问题,建议将csv文件转为ANSI编码再用Excel打开。此外,还提及了使用pgadmin图形界面操作数据库,以及计划学习在Python中直接创建数据库表并添加数据的方法。

1万+

被折叠的 条评论
为什么被折叠?



