我之前没接触过Python,就是想试下爬虫到底是怎么爬的,于是在网上搜些资料写个实例。
网络爬虫:是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。随着信息量的增加,当我们想要获取我门需要的资料信息时,往往要费一番功夫,这时,网络爬虫就可以根据自己写的脚本去获取自己所需的信息,还可以用作企业分析用户资料和行为来提供相应的服务等。
利用Python写爬虫,第一步:要安装运行环境(不安装的话运行不了python程序),我安装的是python2.7,然后在右键->我的电脑->高级系统设置->环境变量->编辑Path值:直接在后面加上你的python程序所在的文件夹的完整路径。
第二步:我是直接在记事本上写的,保存为.py格式,取名为demo吧,我写的是获取知乎网站的网页代码,demo.py程序如下:
# -*- coding:utf-8 -*-
import urllib2
request = urllib2.Request("http://www.zhihu.com/")
response = urllib2.urlopen(request)
print response.read()
wait = input("wait")</

本文介绍了作者初次尝试Python爬虫的经历,从安装Python环境到编写简单的爬虫脚本,展示了如何抓取网页代码的过程。

417

被折叠的 条评论
为什么被折叠?



