selenium driver.get 无限等待加载的问题

最近搞selenium爬虫遇到一个driver.get 打开网页无限等待的问题,自己记录学习一下。


问题描述:

用driver.get打开一个网页,希望在某一元素出现时就执行下面的代码,而不是一直等待网页加载完全。网上很多相关教程都在解释强制等待、显式等待、隐式等待等,大概代码如下:

driver.get('https://www.baidu.com')
WebDriverWait(driver, 10).until(EC.visibility_of_element_located((By.ID,
"kw")))

但是实践后发现有问题。代码会一直卡在driver.get,等待网页加载完全,并不能节省时间。此时的WebDriverWait没有意义,因为当执行到WebDriverWait时,driver.get已经运行完毕,网页已经加载完全,EC.visibility_of_element_located所定位的目标元素必定已经出现。

解决方案

问题分析:

  • 问题出在driver.get默认就是一直等待网页加载,加载完后才会执行下面的代码。

  • Selnium的页面加载策略(pageLoadStrategy)有三种:

  1.  normal:等待整个页面加载完毕再开始执行操作。
  2.  eager:等待整个dom树加载完成,即DOMContentLoaded这个事件完成,也就是只要 HTML 完全加载和解析完毕就开始执行操作。放弃等待图片、样式、子帧的加载。
  3.   none:等待html下载完成,哪怕还没开始解析就开始执行操作。

问题解决: 

  • 所以 ,将加载策略改为eager即可解决问题。
    
    options = Options()
    options.page_load_strategy = 'eager'
    driver = webdriver.Chrome(options=options) #实例化一个浏览器对象
    driver.get(url_test) #访问网页
    
    try:
        WebDriverWait(driver, 5).until(EC.presence_of_element_located((By.ID, "chaptercontent")))
    except:
        print("超时")
    
    

    再配合WebDriverWait,即可实现一旦目标元素出现,立即执行下面的代码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值