用 Python 批量下载百度图片

本文介绍了如何使用Python批量下载百度图片,以制作图像分类数据集。通过解析百度图片的网页源代码,提取图片URL,并利用正则表达式抓取原图链接,最终将图片保存到本地。

为了做一个图像分类的小项目,需要制作自己的数据集。要想制作数据集,就得从网上下载大量的图片,再统一处理。

这时,一张张的保存下载,就显得很繁琐。那么,有没有一种方法可以把搜索到的图片直接下载到本地电脑中呢?

有啊!用python吧!

我以“泰迪”、“柯基”、“拉布拉多”等为关键词,分别下载了500张图片。下一篇,我打算写一个小狗分类器,不知道各位意见如何!

结果演示:

编写思路:

1.获取图片的url链接

首先,打开百度图片首页,注意下图url中的index

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2ktJjTis-1579442276313)(https://upload-images.jianshu.io/upload_images/20782681-2d7c132239e95992?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]

接着,把页面切换成传统翻页版(flip),因为这样有利于我们爬取图片!

对比了几个url发现,pn参数是请求到的数量。通过修改pn参数,观察返回的数据,发现每页最多只能是60个图片。

注:gsm参数是pn参数的16进制表达,去掉无妨

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值