Python 自动操作浏览器

本文介绍了如何使用Python的Selenium库进行浏览器自动化操作,包括安装库和浏览器驱动,设置无头模式,通过XPATH和CSS_SELECTOR选择器获取数据,以及与BeautifulSoup结合解析网页。虽然Selenium操作直观,但速度相对较慢,适合需要动态交互的场景。

1. 安装库

pip install selenium # Windows电脑安装selenium
pip3 install selenium # Mac电脑安装selenium

2.安装浏览器驱动

Chrome浏览器

http://chromedriver.storage.googleapis.com/index.html?path=103.0.5060.134/

3.设置浏览器引擎

# Chrome浏览器设置方法
from selenium import webdriver
#从selenium库中调用webdriver模块
driver = webdriver.Chrome() 
# 设置引擎为Chrome,真实地打开一个Chrome浏览器
driver.close()
#关闭浏览器,以免浪费资源

并不想让浏览器弹出来,浮在其他界面上的话,可以采用下面的写法。

# 本地Chrome浏览器的静默模式设置:
from selenium import  webdriver 
#从selenium库中调用webdriver模块
from selenium.webdriver.chrome.options import Options 
# 从options模块中调用Options类

chrome_options = Options() 
# 实例化Option对象
chrome_options.add_argument('--headless') # 把Chrome浏览器设置为静默模式
driver = webdriver.Chrome(options = chrome_options) 
# 设置引擎为Chrome,在后台默默运行
driver.close()

4.使用selenium获取数据

selenium库同样也具备解析数据、提取数据的能力。它和BeautifulSoup的底层原理一致,但在一些细节和语法上有所出入。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值