我的第一个爬虫程序

最新推荐文章于 2025-07-15 23:00:23 发布

原创

最新推荐文章于 2025-07-15 23:00:23 发布 · 801 阅读

本文介绍了作者初次尝试Python爬虫的经历，从安装Python环境到编写简单的爬虫脚本，展示了如何抓取网页代码的过程。

我之前没接触过Python，就是想试下爬虫到底是怎么爬的，于是在网上搜些资料写个实例。

网络爬虫：是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。随着信息量的增加，当我们想要获取我门需要的资料信息时，往往要费一番功夫，这时，网络爬虫就可以根据自己写的脚本去获取自己所需的信息，还可以用作企业分析用户资料和行为来提供相应的服务等。

利用Python写爬虫，第一步：要安装运行环境（不安装的话运行不了python程序），我安装的是python2.7,然后在右键->我的电脑->高级系统设置->环境变量->编辑Path值：直接在后面加上你的python程序所在的文件夹的完整路径。

第二步：我是直接在记事本上写的，保存为.py格式，取名为demo吧，我写的是获取知乎网站的网页代码，demo.py程序如下：

# -*- coding:utf-8 -*-
import urllib2

request = urllib2.Request("http://www.zhihu.com/")
response = urllib2.urlopen(request)

print response.read()

wait = input("wait")</

最低0.47元/天解锁文章