python简单爬图模板

原创已于 2022-09-28 10:59:36 修改 · 332 阅读

2 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#python #爬虫 #开发语言

收录于

于 2022-09-28 09:58:58 首次发布

Python 专栏收录该内容

2 篇文章

订阅专栏

本文介绍了一个简单的Python爬虫脚本，该脚本能够从指定网页中抓取所有图片，并将其保存到本地文件夹中。通过使用requests库获取网页内容及正则表达式解析图片链接。

python爬虫简单爬取网页图片模板

import requests
import re
def getHTMLTxet(url):
    try:
        r=requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        print("")

'''
 此处的r'<img src=".?">'为爬取网页源码中以<img src="开头以"结尾
 例如:<img src="xxx.jpg"
'''
def proper(list,html):
    ls=re.findall(r'<img src=".*?"',html)  #此处r表达式需要修改
    for i in range(len(ls)):
        list.append(ls[i].split('"')[1])

def main():
    url='此处为要爬取网页图片的网址'  #此处爬取网页网址需要填进去
    text=getHTMLTxet(url)
    jpglist=[]
    proper(jpglist,text)
    x=0
    for i in jpglist:
        x+=1
        r=requests.get(i)
        with open('照片3/'+str(x)+'.jpg','wb') as f:
            f.write(r.content)
            f.close()
            print('{}保存成功'.format(x))
main()