前言:今天是学习爬虫的第一天,因为看的教学视频比较老,所以很多案例都不能用了,于是我自己发挥动手操作,做了个比视频里更有含金量的练习,由于与视频案例大有不同,所以期间发生了点问题,经过探索现已解决,留此纪录。
前面是我一开始犯的错误,最后附上完整代码。
下面是我一开始的操作:
首先我访问古诗文网的登陆页面
登录古诗文网 (gushiwen.cn)
https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx我从它的这个链接就可以看出了估计就是https://so.gushiwen.cn/user/login.aspx这个页面去登录,登录后发生跳转到个人页面。因此其实我用url=‘https://so.gushiwen.cn/user/login.aspx’或者等于上面完整的都是一样的。

一开始我当时用刚学的知识去request.get(略).text 然

本文分享了一次爬取古诗文网登录流程的实战经历,详细记录了解决验证码登录及处理重定向问题的过程,最终实现了利用Python模拟登录。
1692

被折叠的 条评论
为什么被折叠?



