Python 超简单爬取新浪微博数据

最新推荐文章于 2025-05-14 17:35:12 发布

原创

最新推荐文章于 2025-05-14 17:35:12 发布 · 6.4k 阅读

·

1

·

标签

#python #人工智能 #git

本文教你如何使用Python第三方库weiboSpider批量爬取新浪微博数据，包括下载项目、安装依赖、设置cookie和目标用户ID，以及运行爬虫的详细步骤。

新浪微博的数据可是非常有价值的，你可以拿来数据分析、拿来做网站、甚至是*****。不过很多人由于技术限制，想要使用的时候只能使用复制粘贴这样的笨方法。没关系，现在就教大家如何批量爬取微博的数据，大大加快数据迁移速度！

我们使用到的是第三方作者开发的爬虫库 weiboSpider（有工具当然要用工具啦）。

1. 下载项目

进入下方的网址，点击Download ZIP下载项目文件

github.com/dataabc/wei…

或者

你有git的话可以在cmd/terminal中输入以下命令安装

git clone https://github.com/dataabc/weiboSpider.git

2.安装依赖

将该项目压缩包解压后，打开你的cmd/Termianl进入该项目目录，输入以下命令：

pip install -r requirements.txt

便会开始安装项目依赖，等待其安装完成即可。

3.设置cookie

打开weibospider文件夹下的weibospider.py文件，将"your cookie"替换成爬虫微博的cookie，具体替换位置大约在weibospider.py文件的22行左右。cookie获取方法：

3.1 登录微博

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。