爬虫day01(上午) 模拟登录古诗文网

原创

已于 2022-01-25 15:21:38 修改 · 2.2k 阅读

·

14

·

标签

#爬虫

于 2022-01-24 15:39:29 首次发布

本文分享了一次爬取古诗文网登录流程的实战经历，详细记录了解决验证码登录及处理重定向问题的过程，最终实现了利用Python模拟登录。

前言：今天是学习爬虫的第一天，因为看的教学视频比较老，所以很多案例都不能用了，于是我自己发挥动手操作，做了个比视频里更有含金量的练习，由于与视频案例大有不同，所以期间发生了点问题，经过探索现已解决，留此纪录。

前面是我一开始犯的错误，最后附上完整代码。

下面是我一开始的操作：

首先我访问古诗文网的登陆页面

登录古诗文网 (gushiwen.cn)https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx我从它的这个链接就可以看出了估计就是https://so.gushiwen.cn/user/login.aspx这个页面去登录，登录后发生跳转到个人页面。因此其实我用url=‘https://so.gushiwen.cn/user/login.aspx’或者等于上面完整的都是一样的。

一开始我当时用刚学的知识去request.get(略).text 然

最低0.47元/天解锁文章

评论 12

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

老师我作业忘带了 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。