最近想使用tornado做一个爬虫的代理服务器,代理ip从免费代理网站爬取过来,既然是免费的性能肯定不怎么好,所以在把这些代理ip存入数据库之前,需要对代理ip的性能进行测试
查看tornado AsyncHttpClient的源码,发现里面有proxy_host,proxy_port, connect_timeout,request_timeout这正是检测代理所需的参数

使用这些参数之后,代码也不报错,代理始终显示超时,起初我以为是代理ip的性能普遍比较差,然而一个小时之后还是这样,最终在官网发现了这个

本文介绍了在tornado中使用AsyncHttpClient进行代理服务器测试的情况。在尝试使用代理时遇到超时问题,通过查阅官方文档,发现AsyncHttpClient需在curl_httpclient模式下才能正确使用代理。解决方法是在程序初始化时设置相应模式,并确保代理参数正确,如proxy_host、proxy_port,同时在HttpRequest中设置validate_cert=False以解决证书问题。注意代理端口应为数字类型,代理主机为IP地址。

442

被折叠的 条评论
为什么被折叠?



