我的第一个爬虫程序

本文介绍了作者初次尝试Python爬虫的经历,从安装Python环境到编写简单的爬虫脚本,展示了如何抓取网页代码的过程。

我之前没接触过Python,就是想试下爬虫到底是怎么爬的,于是在网上搜些资料写个实例。

网络爬虫:是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。随着信息量的增加,当我们想要获取我门需要的资料信息时,往往要费一番功夫,这时,网络爬虫就可以根据自己写的脚本去获取自己所需的信息,还可以用作企业分析用户资料和行为来提供相应的服务等。


利用Python写爬虫,第一步:要安装运行环境(不安装的话运行不了python程序),我安装的是python2.7,然后在右键->我的电脑->高级系统设置->环境变量->编辑Path值:直接在后面加上你的python程序所在的文件夹的完整路径。

第二步:我是直接在记事本上写的,保存为.py格式,取名为demo吧,我写的是获取知乎网站的网页代码,demo.py程序如下:

 

# -*- coding:utf-8 -*-
import urllib2

request = urllib2.Request("http://www.zhihu.com/")
response = urllib2.urlopen(request)

print response.read()

wait = input("wait")</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值