爬虫常见报错

原创已于 2023-04-03 19:59:02 修改 · 777 阅读

3 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#python #爬虫

收录于

于 2023-03-28 16:43:34 首次发布

from lxml import *
import requests
url="https://book.douban.com/"
header={"User-Agent": "Mozilla/5.0...."}

一、报错’NoneType’ object has no attribute ‘xpath’,------由于反扒机制，需要加上请求头

html= requests.get(url,headers=header)

#二、报错can only parse strings，------加上.text

s=etree.HTML(html.text)

三、报错’lxml.etree._Element’ object has no attribute ‘strip’,-------添加/text（）就能提取正确内容

titles=s.xpath('//*[@id="content"]/div/div[1]/div[1]/div[2]/div[1]/div/ul[2]/li/div[2]/div[1]/a/text()')
for title in titles:
    print(title.strip())

四、最后结果

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yuwangcom

关注关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

多线程爬虫出现报错AttributeError: ‘NoneType’ object has no attribute ‘xpath’

12-21

多线程爬虫出现报错AttributeError: ‘NoneType’ object has no attribute ‘xpath’一、前言二、问题三、思考和解决问题四、运行效果一、前言 mark一下，本技术小白的第一篇CSDN博客！最近在捣鼓爬虫，看的是机械工业出版社的《从零开始学Python网络爬虫》。这书吧，一言难尽，优点是案例比较多，说的也还算清楚，但是槽点更多：1、较多低级笔误；2、基础知识一笔带过，简单得不能再简单，对Python基础不好的人不友好；3、代码分析部分，相同的代码反复啰嗦解释多次，而一些该解释的新代码却只字不提；4、这是最重要的一点，但也不全是本书的锅。就是书中

参与评论您还未登录，请先登录后发表或查看评论

Python中网络爬虫报错的调试与修复：全网最有效最简单的解决方案

最新发布

shejizuopin的博客

04-28

1665

Python网络爬虫的报错调试与修复需要开发者具备一定的耐心和技巧。通过了解常见的报错类型及原因，掌握有效的调试与修复方案，并采取优化措施提高爬虫的性能与稳定性，可以大大提高爬虫的开发效率和成功率。在实际开发过程中，不断积累经验，根据具体情况灵活运用各种方法，才能更好地应对各种复杂的网络环境和网站结构变化。希望本文提供的解决方案能对广大Python爬虫开发者有所帮助。

Python爬虫——xpath出现错误 AttributeError: 'NoneType' object has no attribute 'xpath'

lucky_shi的博客

02-27

3万+

AttributeError: ‘NoneType’ object has no attribute ‘xpath’ 在利用xpath爬取网站信息时 import requests from lxml import etree url = "https://movie.douban.com/top250" html = requests.get(url).text Movie = etree.H...

LXML库XPATH解析HTML

Residual Mark 的博客

09-04

1524

一：简述基于Python做爬虫，在html页面爬取，解析方面，Xpath有极大的优势，也是由于LXML库的丰富功能，使爬虫越来越简单。二：LXML库安装 pip install lxml 1：AttributeError: module ‘lxml’ has no attribute ‘etree’；原因：anaconda中base环境中如果有lxml包的话，虚拟环境就会报错。解决方案：在...

python爬虫报错：AttributeError: ‘NoneType‘ object has no attribute ‘xpath‘

qq440983的博客

08-19

4351

今天学了一下python爬虫，遇到一个报错：AttributeError: 'NoneType' object has no attribute 'xpath'，试了一下网上说的修改路径，不成功，差不多快要绝望的时候，从头到尾检查一遍代码才发现我在写请求头的时候把。真是不该的低级错误，而且Pycharm没有把问题行定位正确，只是定到了“xpath”这一行，其他的没有报错。

多线程爬虫出现报错AttributeError: 'NoneType' object has no attribute 'xpath'

weixin_42422267的博客

03-30

1万+

多线程爬虫出现报错AttributeError: 'NoneType' object has no attribute 'xpath'一、前言二、问题思考和解决问题运行效果如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchar...

Python爬虫总结——常见的报错、问题及解决方案

WoLykos

12-24

1万+

在爬虫开发时，我们时常会遇到各种BUG各种问题，下面是我初步汇总的一些报错和解决方案。在以后的学习中，如果遇到其他问题，我也会在这里进行更新。各位如有什么补充，欢迎评论区留言~~~ 问题： IP被封，或者因访问频率太高被拦截？？？解决方案之一：使用代理IP即可。问题：正确使用XPath之后并没有输出？？？解决方案之一： XPath只能提取未注释的代码，改用正则表达式即可。 ...

python爬虫常见报错_python爬虫入门常见错误集合

weixin_39911998的博客

11-28

1204

在入门爬虫的时候遇到不少问题，和不是唯一的解决方法的方法，总结整理一下，供大家学习交流。syntaxerror: invalid syntax语法错误：无效语法syntaxerror: unexpected EOF while parsing语法错误：多了无法解析的符号（检查是否多了或少了括号）syntaxerror: invalid character in identifier语法错误：有无效...

python爬虫常见报错_Python爬虫总结——常见的报错、问题及解决方案

weixin_39654245的博客

11-28

3199

在爬虫开发时，我们时常会遇到各种BUG各种问题，下面是我初步汇总的一些报错和解决方案。在以后的学习中，如果遇到其他问题，我也会在这里进行更新。各位如有什么补充，欢迎评论区留言~~~问题：IP被封，或者因访问频率太高被拦截？？？解决方案之一：使用代理IP即可。问题：正确使用XPath之后并没有输出？？？解决方案之一：XPath只能提取未注释的代码，改用正则表达式即可。问题：容易被反爬搞死？？？解决方...

python爬虫常见报错_Python爬虫系列之什么是爬虫

weixin_39640883的博客

11-28

400

时间过的总是那么快，特别是对于一个有拖延症的人来说，例如我...早就想出一个关于爬虫的系列教程，但总是被自己的拖延症和一系列的杂碎事情打断。最近终于将自己的所有事情以及自己最真实的想法捋顺了，所以决定接下来的一段时间里会抽出大量的时间学习巩固更多的爬虫知识并将其书写分享出来，供对爬虫感兴趣或从事相关职业的同胞们学习参考。本人就是一枚从事python开发的程序猿，目前因为个人的私事原因不得不弃业置家...

Python爬虫常见问题----出现AttributeError: ‘NoneType‘ object has no attribute ‘xpath‘报错

2301_79969279的博客

01-29

2426

此处我在修改了错误的html格式后就可以成功运行了，如果html没错之后还是无法运行可以尝试使用其他html解析库，如BeautifulSoup，它可以处理一些不规范的html文本。之所以会出现这种情况，说明是etree.HTML解析失败了，这可能是由于需要解析的内容html的格式不正确或者不完整导致的，也可能是由于解析器不支持该html格式。print(type(et))后，返回的类型即为NoneTpye说明获取到的对象是None,而None是没有xpath属性，所以会报错。

Python报错：AttributeError: ‘xml.etree.ElementTree.Element‘ object has no attribute ‘strip‘

m0_69305580的博客

08-26

1958

不得不说，这里我搜索到的问题现象，简直与自己遇到的问题真的一毛一样，美滋滋乐开怀，我硬着头皮在各英文单词之间寻找可以拿来即用的解决办法。根据首行报错信息，我们在Google浏览器中搜索，发现别人也遇到了同样的报错，一毛一样，顿时心里乐开了花，这意味着我们很有可能只要依葫芦画瓢，便可以解决了当下的问题。这里我们根据错误提示信息，层层递进能够发现，最终在xml这块报错，而xml是一个python库，在使用之前需要安装。待安装成功后，再运行原脚本，不再报错，问题解决，工作完成，又是充实的一天。

AttributeError: lxml.etree._Element object has no attribute xpth

Ducunyu的博客

10-01

1万+

AttributeError: lxml.etree._Element object has no attribute xpth import lxml.etree as le # 分析 xpath 语句，提取1级分类 # xpath1=xpth('//div[@class="floor-container popular_recommend"]/text()') # 继续分析 HTML结构，提取2级分类 # xpath2=xpath('//div[@class="floor-container popu

Django解决AttributeError: ‘tuple‘ object has no attribute ‘startswith‘问题

王献运的博客

05-09

5810

问题：AttributeError: 元组对象没有属性'startswith'解决方法

AttributeError: 'lxml.etree._Element' object has no attribute 'translate'

work_you_will_see的博客

11-29

2万+

       此处的错误是我在利用lxml下的etree爬取拉勾网时出现的错误方法:        把你要爬取的内容用print输出一遍看看是不是存在json数据代码如下： positionName=html.xpath("//div[@class=

AttributeError lxml.etree Element object has no attribute get_attribute

胡侃有料的博客

06-18

7599

every blog every motto: We would rather reuse an active dwarf than a sleeping giant. 0. 前言用xpath 提取信息时，遇到的报错 1. 正文源码 request_list = [] req = htmled.xpath('//div[@class="li_b_l"]') for i in req: request_list.append(i.get_attribute('i

scrapy出现：AttributeError: 'list' object has no attribute 'xpath'

滇北小生

02-26

1万+

scrapy: 'list' object has no attribute 'xpath'

scrapy xpath解析出现：AttributeError: 'list' object has no attribute 'xpath'