1. 环境搭建:从零到一,让你的浏览器“活”起来
好了,咱们直接进入正题。我知道很多朋友一听到“自动化测试”、“写脚本”这些词,就觉得头大,感觉是那些资深程序员才玩得转的东西。其实真不是,我刚开始接触的时候也是零基础,连Python都写得磕磕绊绊。但Selenium这玩意儿,它最大的好处就是“所见即所得”,你手动在浏览器里能做的操作,它几乎都能帮你自动化。今天这篇实战,我就带你一步步走,保证你能亲手写出第一个能自动打开网页、搜索内容的脚本。
首先,你得有个“舞台”。这个舞台就是你的编程环境。别怕,我们一步步来,我踩过的坑,你直接绕过去就行。
1.1 安装Python与Selenium库
Python是我们的“指挥棒”,Selenium是“遥控器”。你得先有指挥棒,才能拿起遥控器去控制浏览器。
-
安装Python:如果你还没装Python,直接去官网(python.org)下载最新稳定版。安装时,千万记得勾选“Add Python to PATH”这个选项,这能省去后面配置环境变量的一大堆麻烦。安装完,打开你的命令行(Windows叫CMD或PowerShell,Mac叫终端),输入
python --version或者python3 --version。如果蹦出来一个版本号,比如“Python 3.9.5”,那就恭喜你,第一步成功了。 -
安装Selenium库:有了Python,安装第三方库就简单得像点外卖。在刚才的命令行里,输入下面这行命令,然后回车:
pip install selenium如果速度慢,可以试试国内的镜像源,比如清华的:
pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple看到“Successfully installed”的字样,就说明Selenium这个强大的遥控器已经送到你手里了。
1.2 搞定浏览器驱动:Chromedriver的“配对”秘诀
这是新手最容易卡住的地方,也是我今天要重点讲的。你可以把Chrome浏览器想象成一辆性能超跑,而你的Selenium代码是驾驶员。但是,光有驾驶员和跑车还不行,中间还需要一个“翻译官”,把驾驶员的指令(Python代码)翻译成跑车能听懂的语言(浏览器操作)。这个翻译官就是 Chromedriver。
-
查看浏览器版本:打开你的Chrome浏览器,点击右上角的三个点 -> 帮助 -> 关于Google Chrome。你会看到类似“版本 91.0.4472.124(正式版本)”的信息。记住这个主版本号,比如 91。
-
下载对应驱动:驱动版本必须和你的浏览器主版本号匹配。去Chromedriver的官方下载站(https://chromedriver.chromium.org/)或者国内镜像站(比如淘宝的NPM镜像:https://npm.taobao.org/mirrors/chromedriver/)。找到和你浏览器版本号一致的目录(比如91.0.4472.x),根据你的操作系统(Windows选win32,Mac选mac64)下载zip文件。
-
放置驱动:下载后解压,你会得到一个
chromedriver.exe(Windows)或chromedriver(Mac/Linux)文件。我强烈建议你把它放在一个固定的、好记的、路径里没有中文和空格的目录下。比如我习惯放在D:\drivers\或者/Users/你的用户名/drivers/。记住这个完整路径,我们马上要用。
注意:很多教程让你把驱动放到Python的安装目录或者系统PATH里,这当然可以。但对于新手,我建议先用绝对路径,这样最直观,出了问题也最好排查。等玩熟了,再考虑配置环境变量。
2. 第一个脚本:让浏览器自动打开网页
环境齐备,是时候写点真正的代码了。别紧张,就几行,咱们一行行看。
2.1 编写“Hello World”级脚本
打开你喜欢的代码编辑器(VS Code、PyCharm甚至记事本都行),新建一个Python文件,比如叫 first_test.py。然后,把下面的代码一字不差地敲进去(当然,路径要换成你刚才放驱动的实际路径):
# 导入webdriver模块,这就是我们的“遥控器”核心
from selenium import webdriver
# 指定你的“翻译官”Chromedriver在哪里
driver_path = "D:/driver


4078

被折叠的 条评论
为什么被折叠?



