Python爬虫练习2_小图片下载

最新推荐文章于 2026-06-22 23:38:57 发布

原创最新推荐文章于 2026-06-22 23:38:57 发布 · 974 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#python #html

4 篇文章

订阅专栏

本文介绍了使用Python进行小图片下载的步骤，包括伪装浏览器以避免反爬，通过网页源代码获取图片链接，并展示了一个简单的循环下载图片的示例。

准备工具

今天有点难，因为我的PyCharm体验到期了，运行工具就用python3.8自带的IDLE（好的coder要学废用各种工具！）

开始之前先导入一些库

import urllib.request
from urllib import request
from bs4 import BeautifulSoup

获取网页源代码，对网页的分析我在上一个练习上已经介绍过，这里就不做介绍了，今天介绍一下新的获取网页代码的方式，添加header，就是伪装成浏览器避免反爬。怎么去查看一个网页的header呢还是利用F12随便找一个有图片的网站，我这里网络有些问题一些CSS样式加载不出来，不要紧，关键看截图点开Network找到Headers往下扒拉，找到一个User-Agent，今天比较简单就把这个User-Agentcopy下来就好了。
```
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
req = request.Request(url,headers=headers)
contens = page.read()
print(contens)
```
返回结果

这就是网页的代码，这就证明我们访问到这个页面了。
获取图片
获取图片的方式和文章是一样的，不同的是图片就在页面上直接找图片的链接就好了，随便搜一个明星易烊千玺找到img标签，找标签的方式也不再介绍。

图片获取连接就很简单了直接用find_all具体用法自行百度

	soup = BeautifulSoup(contens,'html.parser')
	im = soup.findAll('img',attrs={"alt":"易烊千玺"})

然后做一个简单的循环，也不多说，不明白的看上一篇文章，然后拿出所有的图片地址。

拿到所有图片链接就可以下载啦。
感谢各位观看。

想转型做一名爬虫架构师的朋友，推荐学习！
扫码下单输优惠码【csdnfxzs】再减5元，比官网还便宜！
在这里插入图片描述