使用python进行抓取的一个例子
from mechanize import Browser
br = Browser()
br.addheaders = [('User-agent', 'xxxxx'),]
br.set_handle_robots(False)
# use proxy
br.set_proxies({"http":"user_name:passwd@host:port"})
br.open(url)
br.response().read()
本文介绍如何使用Python编写网络爬虫程序,包括设置浏览器头部信息、使用代理、发送请求及获取响应等内容。
使用python进行抓取的一个例子
from mechanize import Browser
br = Browser()
br.addheaders = [('User-agent', 'xxxxx'),]
br.set_handle_robots(False)
# use proxy
br.set_proxies({"http":"user_name:passwd@host:port"})
br.open(url)
br.response().read()

被折叠的 条评论
为什么被折叠?
