py爬虫学习3.1-3.2

1.前言

爬虫真的难!

2.学习内容

2.1图片数据爬取

 #需求:爬取糗事百科中糗图板块下所有的糗图图片
 import requests
 if __name__ == '__main__':
     #如何爬取图片数据
     url='https://pic.qiushibaike.com/system/pictures/12487/124871233/medium/VZ7XN8XIPCOGTQVT.jpg'
     # .content返回的是二进制图片数据 (图片是二进制)
     #text返回的是字符串形式的图片数据,content是二进制 json()返回的是对象类型的数据
     img_data=requests.get(url=url).content
 ​
     with open('.qiutu.jpg','wb') as fp:
         fp.write(img_data)

2.2正则案例解析

 import requests
 import re
 import os
 if __name__ == '__main__':
     #创建一个文件夹用来保存所有图片
     if not os.path.exists('.qiutuLibs'):
         os.mkdir('qiutuLibs')
 ​
     url='https://www.qiushibaike.com/imgrank/'
     headers = {
         'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) A
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值