scrapy item.py

最新推荐文章于 2026-06-22 22:05:57 发布

原创最新推荐文章于 2026-06-22 22:05:57 发布 · 213 阅读

·

0

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#python

本文详细介绍了Scrapy爬虫框架中Item的使用方法，包括定义、导入及实例化过程，以及如何通过XPath提取数据并存储到Item字段中。

1.概念

1.即提前规划好哪些字段需要抓，防止手误，因为定义好之后，在运行过程中，系统会自动检查
2.在目标字段少的时候可以使用字典代替
3.使用scrapy的一些特定组件需要Item做支持，如scrapy的ImagesPipeline管道类

2.语法

在items.py文件中定义要提取的字段：
1）定义

class MyspiderItem(scrapy.Item): 
    name = scrapy.Field()   # 讲师的名字
    title = scrapy.Field()  # 讲师的职称
    desc = scrapy.Field()   # 讲师的介绍

2）导入

item定义以后需要在爬虫中导入并且实例化，之后的使用方法和使用字典相同
python中的导入路径要诀：从哪里开始运行，就从哪里开始导入

job.py：

from myspider.items import MyspiderItem   # 导入Item，注意路径
...
    def parse(self, response)
        item = MyspiderItem() # 实例化后可直接使用
        item['name'] = node.xpath('./h3/text()').extract_first()
        item['title'] = node.xpath('./h4/text()').extract_first()
        item['desc'] = node.xpath('./p/text()').extract_first()
        yield item # 将结果交给引擎，送给pipeline

博客等级

码龄11年

2709
原创

1451
点赞

4981
收藏

1396
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: python 自定义异常

下一篇：: scrapy

最新评论

reveal.js
2501_93527228: # 我喜欢的民族艺术副标题：幼儿园大班探索有趣的传统艺术主题图片：![民族艺术小图](placeholder-image-link) （实际使用时替换为儿童版民族艺术图片） ## 什么是民族艺术？民族艺术是不同民族的传统文化艺术哦！ - 🤔 就像画画、唱歌、跳舞 - 🌍 每个民族都有自己的特色，比如汉族、蒙古族等 - ✨ 让我们一起感受美丽和快乐！ ## 有趣的民族艺术例子我们看看几种好玩的艺术形式： | 民族 | 艺术形式 | 特点（小朋友能理解的） | | ---- | -------- | -------------------- | | 汉族 | 剪纸 | 用纸剪出小鸟、花朵，色彩漂亮，需要小剪刀！ | | 蒙古族 | 筷子舞 | 拿小筷子跳舞，像小马跑起来一样动听~ | | 藏族 | 图画故事 | 画美丽的雪山和动物，故事很神奇~ | （注：表格格式基于Markdown要求优化，避免重复冗余） ## 我最喜欢的民族艺术：剪纸我喜欢汉族的剪纸艺术！ - 💕 为什么喜欢：纸片变成小鸟和鱼，好玩又漂亮~ - 🎨 自己动手：小朋友可以折纸剪一剪，小心用剪刀哦！ - ![剪纸示范图](placeholder-image-link) ## 我们一起玩一玩吧！小朋友们，让我们试试： 1. 模仿剪纸：用彩纸剪个小爱心 2. 跳个民族舞：轻轻摇摆身体，像小鸟飞 - 🎶 小提示：和老师一起，安全第一哦 # 总结：民族艺术真有趣！今天我们学到了：不同民族的艺术很美，一起保护它~ 鼓励语：小朋友们，回家和家人分享你喜欢的艺术吧！

大家在看

最新文章

· AI 阅读助手

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。